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内 容 简 介 


本 书 第 1 章 讨论 算法 设计 、 分 析 的 基本 概念 。 第 2 章 讨 论 算法 设计 中 最 常用 的 几 个 数据 结构 ,包括 链 
表 、 栈 .队列 二 又 搜索 树 . 散 列表 等 。 第 3 章 讨 论 了 算法 设计 的 两 个 基本 策略 : 渐 增 策略 与 分 支 策略 。 第 1 一 
3 章 的 内 容 , 为 读者 阅读 本 书 以 后 的 内 容 莫 定 了 基础 。 第 4 章 讨 论 几 个 代数 计算 的 基本 问题 及 其 算法 , 包 
括 矩 阵 运算 . 解 线性 方程 组 ,多 项 式 运算 等 。 第 5 章 讨论 几 个 关于 计算 几何 的 基本 问题 及 其 算法 ,包括 线 
段 的 相交 判断 ,平面 点 集 的 凸 包 计算 、 最 邻近 点 对 问题 等 。 第 6 章 讨论 了 关于 整数 运算 的 基本 问题 ,包括 
大 整数 的 表示 与 运算 .最 大 公约 数 计 算 、 模 运算 ,素数 判定 及 整数 因数 分 解 等 。 第 4 一 6 章 的 内 容 为 读者 深 
人 学 习 解 决 各 种 复杂 问题 葛 定 了 解决 数学 计算 问题 的 基础 。 第 7 一 9 章 分 别 用 回溯 策略 ,动态 规划 策略 及 
贪 禁 策略 研究 .解决 计算 机 应 用 面临 的 最 普遍 、 最 典型 的 组 合 优化 问题 。 第 10 章 讨 论 图 的 搜索 算法 及 其 
应 用 ,包括 深度 优先 搜索 .拓扑 排序 有 向 图 的 强 连通 分 支 计算 ,关节 点 计算 ,广度 优先 搜索 .网络 最 大 流 及 
二 部 图 的 最 大 匹配 等 问题 。 第 11 章 讨 论 了 几 个 文本 搜索 的 有 趣 算法 ,包括 著名 的 KMP 模式 匹配 算法 、 线 
性 时 间 计 算 字 符 串 中 最 长 回 文子 串 的 Manacher 算法 、 用 动态 规划 策略 寻求 字符 串 中 指定 模式 的 最 佳 近似 
匹配 的 算法 。 对 所 有 的 的 经 典 算法 及 数据 结构 , 书 中 给 出 C 语言 的 实现 函数 ,形成 一 个 通用 的 函数 库 ,并 
详尽 地 加 以 解析 。 伴 随 各 种 算法 的 设计 、 分 析 及 程序 实现 , 书 中 给 出 了 丰富 多 彩 的 应 用 问题 及 其 解决 方案 
的 讨论 ,并 给 出 了 完整 的 程序 代码 。 所 有 程序 代码 都 经 过 反复 调试 ,第 12 章 介 绍 这 些 代码 的 使 用 方法 。 
所 有 代码 都 以 网 络 资源 的 方式 提供 给 读者 ,访问 下 载 地 址 为 www. tup. com. cn。 

本 书 无 论 是 对 初学 算法 及 程序 设计 入 门 的 大 学 生 读 者 还 是 对 已 经 在 职场 打拼 多 年 的 程序 员 并 有 提高 
自身 理论 修养 及 技术 水 平 愿望 的 读者 都 有 开卷 有 益 的 意义 。 
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第 2 版 前 言 


本 书 第 1 版 已 经 面世 近 2 年 了 。 承 蒙 读者 厚爱 及 清华 大 学 出 版 社 的 大 力 支持 , 遂 有 了 
今天 第 2 版 的 问世 。 

根据 广大 读者 的 意见 反馈 ,在 第 1 版 的 基础 上 , 除 对 原 有 内 容 中 所 含 明 显 错漏 之 处 进行 
修改 以 外 ,第 2 版 增加 了 关于 文本 搜索 的 一 些 有 趣 的 算法 ,包括 著名 的 KMP 模式 匹配 算 
法 .线性 时 间 内 计算 给 定 字符 串 中 最 长 回 文 子 串 的 Manacher 算法 和 文本 串 中 模式 最 佳 近 
似 匹 配 的 动态 规划 算法 。 所 有 这 些 算法 都 涵盖 于 第 11 章 中 。 考 虑 到 原来 的 第 11 章 介 绍 了 
验证 运行 本 书 各 章 应 用 问题 程序 时 需 加 载 文 件 等 细节 ,这 对 喜欢 动手 的 读者 来 说 是 很 有 帮 
助 的 ,所 以 保留 了 原来 的 内 容 并 将 第 11 章 讨论 的 3 个 应 用 问题 程序 的 运行 加 载 信息 也 补充 
了 进去 ,作为 第 12 章 。 所 有 这 些 添加 \ 改 动 都 是 为 了 对 读者 阅读 本 书 有 所 帮助 ,并且 能 通过 
对 本 书 的 阅读 能 让 更 多 的 年 轻 朋 友 在 信息 时 代 具 有 良好 的 计算 思维 能 力 和 操控 计算 机 的 
能 力 。 

网 络 已 经 成 为 人 们 获取 信息 数据 的 最 方便 快捷 的 工具 了 。 本 书 第 1 版 中 源 代码 是 以 
传统 的 光盘 形式 提供 给 读者 ,本 意 是 方便 读者 随手 可 用 。 第 2 版 将 以 网 络 资源 形式 提供 给 
读者 ,具体 的 访问 地 址 是 www. tup. com. cn. 

为 使 作者 和 读者 之 间 更 方便 、 直 接地 交流 沟通 ,作者 的 QQ 号 及 空间 地 址 公布 如 下 。 

QQ 号 :513410359。 

空间 地 址 : user. qzone. qq. com/513410359? ptlang 一 2052 。 

再 次 感谢 清华 大 学 出 版 社 的 白 立 军 先 生 , 没 有 他 的 支持 和 帮助 ,无 论 是 本 书 的 第 1 版 还 
是 今天 的 第 2 版 都 不 会 如 此 顺利 地 送 到 读者 的 面前 。 


徐子珊 
2015 年 3 月 


第 1 版 前 言 


学 科 的 基本 问题 和 基本 方法 是 学 科 方 法 论 的 基本 内 容 。 计 算 机 能 解决 的 仅仅 是 计算 问 
题 而 已 。 什 么 是 计算 问题 7 有 哪些 典型 的 计算 问题 ? 如 何 描 述 计算 问题 是 计算 学 科 的 基本 
问题 之 一 ,也 是 计算 机 应 用 的 前 提 。 将 问题 与 数据 加 以 形式 化 表示 ,并 设计 解决 计算 问题 的 
算法 ,评价 算法 的 运行 效率 是 计算 学 科 的 基本 方法 。 本 书 的 每 一 章 都 围绕 一 类 或 一 个 计算 
问题 的 形式 化 描述 和 算法 及 其 分 析 展 开 。 在 开卷 之 前 , 先 粗 线条 地 向 读者 描述 一 下 本 书 。 

计算 问题 来 自 现实 世界 ,现实 世界 五 彩 缤纷 ,计算 问题 多 种 多 样 。 本 书 按 典 型 计算 问题 
的 分 类 来 组 织 各 章 内 容 , 包 括 计 数 问题 .代数 计算 问题 计算 几何 问题 ,数论 问题 ,组 合 优化 
问题 和 图 的 搜索 问题 。 

计数 问题 是 最 古老 的 但 也 是 人 类 生活 须 奥 不 能 离开 的 计算 问题 ,特别 是 在 现代 科技 与 
工业 领域 存在 大 量 的 计数 问题 。 用 计算 机 快速 解决 计数 问题 是 实 至 名 归 。 第 1 章 讨 论 解决 
计数 问题 的 基础 是 加 法 原理 和 乘法 原理 的 应 用 。 

为 了 让 读者 清楚 地 看 到 数据 组 织 方式 对 算法 设计 方法 及 算法 运行 效率 的 影响 ,在 第 2 
章 中 浓缩 了 关于 线性 表 、 二 又 树 . 散 列 表 等 最 基础 的 几 个 数据 结构 。 

数学 中 的 计算 问题 更 是 比比 丝 是 。 数 学 问题 的 算法 ,如 解 线性 方程 组 .计算 多 项 式 的 变 
换 、 线 段 之 间 的 位 置 关系 等 也 是 很 多 信息 处 理应 用 问题 中 经 常 要 用 的 基本 操作 。 本 书 用 
第 4 一 6 章 的 篇 幅 讨 论 代数 、 几 何 及 数论 中 的 典型 计算 问题 的 算法 ,所 用 的 方法 是 第 3 章 中 
介绍 的 渐 增 性 策略 和 分 治 策略 。 

在 多 个 可 能 解 中 寻求 最 优 解 的 组 合 优化 问题 是 计算 学 科 面 对 的 最 典型 的 问题 ,因为 人 
类 的 活动 几乎 都 涉及 资源 的 竞争 ,而 有 资源 竞争 就 会 产生 组 合 优化 问题 。 本 书 用 第 7 一 9 章 
的 内 容 来 讨论 组 合 优化 问题 的 解决 方法 。 讨 论 是 按 从 大 到 小 收缩 解 空间 的 线索 展开 。 从 无 
约束 的 回溯 策略 开始 ,到 加 上 最 优 子 结构 性 质 及 子 问题 重 和 至 性 质 后 的 动态 规划 策略 , 解 空间 
越 小 ,算法 效率 越 高 。 笔 者 试图 以 这 样 的 全 方位 的 讨论 组 合 优化 问题 解决 方法 的 形式 ,引导 
读者 深入 理解 启发 式 解 题 思想 方法 。 

在 第 10 章 讨论 一 个 描述 应 用 问题 的 重要 数学 模型 一 一 图 。 重 点 讨论 图 中 顶点 的 搜索 
算法 。 利 用 搜索 算法 ,讨论 了 诸如 拓扑 排序 、 关 节点 计算 、 网 络 流 等 几 个 经 典 的 关于 图 的 应 
用 问题 。 

算法 研究 历史 悠久 。 然 而 今天 ,算法 理论 研究 落脚 点 在 于 指导 计算 机 程序 设计 实践 。 
本 书 讨论 的 每 一 个 经 典 算法 , 均 用 C 语言 写成 了 通用 的 功能 函数 ,并 用 这 些 函 数 解决 了 一 
系列 有 趣 的 应 用 问题 。 第 11 章 汇总 了 这 些 函 数 的 原型 声明 及 数据 结构 的 定义 。 

本 书写 作 上 除了 上 述 的 内 容 组 织 形式 上 的 特点 外 ,还 用 心 于 以 下 几 点 。 


1. 理论 严谨 ,语言 规范 


对 每 一 个 问题 的 算法 ,从 问题 的 分 析 开 始 , 包 括 思 路 的 发 展 ,算法 的 描述 ,正确 性 证 明 ， 
运行 时 间 的 计算 都 加 以 详尽 讨论 ,让 读者 能 体验 到 计算 学 科 的 科学 严谨 性 。 算 法 设计 与 分 
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析 以 理论 繁复 著称 。 笔 者 试图 以 朴实 的 文字 和 平和 的 阐述 展示 对 问题 的 分 析 , 算 法 步骤 的 
思考 和 运行 时 间 估 算 。 在 确保 科学 性 、 正 确 性 的 前 提 下 尽量 使 用 与 生活 语言 相近 的 词语 而 
避免 使 用 过 多 生僻 的 专用 术语 ,让 读者 在 阅读 中 感受 本 书 语言 的 自然 亲切 。 


2. 理论 与 实践 互动 


笔者 对 每 一 个 理论 算法 都 给 出 现 有 技术 的 程序 实现 ,用 以 验证 理论 算法 的 正确 性 。 虽 
然 此 前 已 经 在 理论 上 证 明了 算法 的 正确 性 ,但 通过 实现 了 的 程序 的 正确 运行 进一步 证 明理 
论 是 可 行 的 。 并 且 , 算 法 的 程序 实现 及 对 测试 数据 的 调试 运行 能 使 读者 深入 理解 算法 的 思 
想 及 其 中 细节 微妙 之 处 。 对 书 中 的 每 一 个 经 典 算法 , 均 精 选 了 1 一 2 个 应 用 问题 ,或 说 明 如 
何 直 接 调 用 算法 解决 该 问题 ,或 说 明 如 何 运 用 算法 设计 的 思想 解决 问题 。 问 题 均 选 自 
ACM/ICPC 的 赛 题 或 北京 大 学 的 网 站 http: //poj. org/problemlist。 


3. 小 步 推 进 ,深入 浅 出 


要 设计 一 个 算法 来 解决 计算 问题 往往 是 比较 复杂 的 。 对 复杂 问题 分 析 以 及 设计 解决 问 
题 的 算法 并 对 其 进行 分 析 , 进 而 实现 为 程序 难免 行文 比较 元 长 。 为 减轻 读者 阅读 疲劳 ,在 保 
证 内 容 完 整 性 的 前 提 下 ,适当 地 将 问题 分 析 、 算 法 设计 分 析 以 及 程序 实现 复杂 过 程 按 一 定 的 
内 部 巡 辑 分 解 成 若干 部 分 ,一 步 一 个 小 标题 。 读 者 可 依次 一 步 一 步 连续 阅读 ,也 可 分 多 次 ， 
每 次 阅读 一 个 部 分 。 阅 读 时 可 通过 小 标题 明确 自己 在 整个 过 程 中 的 那 一 部 分 ,又 不 失 对 全 
局 的 掌控 。 


4. 图 文 并 茂 ,生动 形象 


算法 的 基础 是 数学 ,数学 讲 的 是 逮 辑 思维 。 然 而 , 逮 辑 思维 并 不 排斥 形 象 思维 ,形象 思 
维 有 时 可 为 逻辑 思维 深入 推进 助力 。 为 帮助 读者 快速 且 正 确 地 理解 抽象 概念 ,或 思想 方法 ， 
或 微妙 的 技术 细节 , 书 中 在 适宜 的 地 方 插入 很 多 精心 绘制 的 插图 。 通 过 这 些 插图 读者 可 对 
书 中 相应 的 文字 或 符号 表述 的 理论 .方法 或 技术 内 容 有 生动 .形象 的 认识 。 


5. 通用 代码 ,便于 引用 


本 书 中 对 所 有 算法 的 程序 实现 并 非 简 单 的 代码 堆砌 。 笔 者 对 所 实现 的 每 一 个 C 函数 
参数 与 返回 值 ,数据 与 变量 的 设置 及 关键 代码 都 进行 了 详尽 的 解析 。 并 且 将 大 多 数 算法 和 
数据 结构 写成 通用 的 代码 ,以 光盘 的 形式 向 读者 提供 类 似 于 C++ 的 STL 或 Java 的 
Collection Framework 的 通用 库 , 便 于 读者 在 工作 中 或 生活 中 需要 时 引用 。 本 书 算法 中 的 
伪 代 码 的 编写 规范 参照 (Introduction to Algorithm) 一 书 中 的 体例 。 

为 方便 选用 本 书 作为 算法 课程 教材 的 教师 朋友 使 用 , 随 书 光盘 中 提供 了 PPT 格式 的 
课件 。 


徐子珊 记 于 山城 重庆 
2012 4F 10 月 
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sim 计算 问题 


1.1 计算 问题 及 其 算法 


1.1.1 计算 问题 及 其 描述 


众所周知 ,计算 机 并 不 能 解决 所 有 问题 。 事实 上 ,计算 机 只 能 解决 一 类 称 为 “计算 问题 ” 
的 问题 。 所 谓 计算 问题 , 指 的 是 问题 中 所 涉及 的 事物 或 其 属性 可 用 数据 加 以 表示 一 一 称 为 
输入 数据 ,问题 的 解 也 可 以 表示 成 数据 一 一 称 为 输出 数据 ,并 且 可 以 在 有 限 步 基本 计算 ( 算 
术 运 算 、 人 逻辑 运算 以 及 数据 的 暂 存 等 ) 后 ,将 特定 的 输入 数据 转换 成 正确 的 输出 数据 的 问题 。 
解 计算 问题 就 是 将 输入 数据 转换 成 正确 的 输出 数据 的 过 程 。 

利用 计算 机 解决 现实 问题 ,首先 需要 将 问题 抽象 成 计算 问题 ,也 就 是 提炼 出 问题 的 输入 
数据 和 研究 问题 的 解 的 数据 特性 。 将 问题 表示 为 输入 与 输出 的 描述 。 例 如 ,在 一 系列 数据 
中 查找 特定 值 元 素 的 查找 问题 可 以 描述 如 下 。 

输入 : nn 个 数 构成 的 序列 A 二 二 ai ,az eta, > RAE x. 

输出 : 若 序列 A 中 存在 元 素 A[ 门 ,其 值 等 于 zx, 返回 从 左 到 右 的 第 一 个 值 为 z 的 元 素 
的 下 标 i。 否 则 ,返回 一 1。 

例如 ,在 线性 表 A= 二 3.,6,0,4,1,7,9,5,2,8 二 中 查找 特定 值 x 的 元 素 。 图 1-1(a) 为 
查找 值 为 +=1 的 元 素 ,从 A[1] 起 依次 要 做 5 次 检测 ,第 1 次 找到 值 为 1 的 元 素 。 图 1-1 
(b) 为 查找 值 为 z==11 的 元 素 , 从 A[1] 起 依次 检测 完 所 有 元 素 ( 做 10 次 检测 ) ,没有 找到 值 
为 11 的 元 素 一 一 最 坏 情 形 。 图 1-1(c) 为 查找 值 为 x 二 3 的 元 素 , 从 A[1] 起 仅 做 一 次 检测 
就 找到 值 为 3 的 元 素 一 一 最 好 情形 。 
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(c) 
1-1 在 一 系列 数据 中 查找 特定 元 素 
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1.1.2 算法 及 其 描述 


将 问题 描述 成 其 输入 与 输出 后 ,就 要 考虑 按 什么 样 的 顺序 安排 有 限 步 的 基本 计算 ,将 输 
入 数据 转换 成 输出 数据 ,这 个 过 程 称 为 算法 设计 。 安 排 好 的 计算 步骤 称 为 解决 计算 问题 的 
算法 。 一 个 算法 对 问题 输入 的 任何 特定 数据 都 能 得 到 正确 的 输出 数据 , 则 称 算法 是 正确 的 。 
对 计算 问题 设计 正确 的 算法 ,需要 人 们 对 问题 有 深入 地 理解 ,利用 已 有 的 数学 和 相关 学 科 的 
科学 知识 以 及 生活 常识 ,设计 出 从 输入 数据 到 输出 数据 的 计算 转换 过 程 。 例 如 ,对 上 述 在 序 
列 中 查找 特定 值 的 问题 ,人 们 可 以 用 如 下 线性 查找 算法 。 

解决 计算 问题 的 算法 可 以 用 各 种 方法 加 以 描述 。 常 用 的 有 自然 语言 描述 法 ,流程 图 描 
述 法 和 伪 代 码 描述 法 。 用 自然 语言 描述 算法 优点 是 表达 能 力 很 强 , 表 述 方便 。 例 如 ,解决 上 
述 线性 查找 算法 可 用 自然 语言 描述 如 下 。 

从 序列 的 起 点 元 素 开始 ,依次 检测 元 素 的 值 是 
否 等 于 x+。 直 至 某 个 元 素 a, 的 值 等 于 zx, 停止 检测 ， 
返回 i。 车 检测 完 所 有 的 元 素 ( 超 过 终点 ) 示 发 现任 
何 元 素 的 值 等 于 z, 则 返回 一 1 。 

用 自然 语言 描述 算法 虽然 方便 ,但 有 一 个 致命 
弱点 : 自然 语言 的 字句 可 能 存在 歧义 , 即 一 个 字句 
可 以 有 不 同 的 理解 ,这 在 描述 算法 时 是 不 允许 的 。 
用 流程 图 描述 算法 可 以 避免 这 一 缺陷 。 仍 然 以 线性 
查找 算法 为 例 , 用 流程 图 描述 如 图 1-2 所 示 。 

用 流程 图 描述 算法 克服 了 自然 语言 描述 法 的 字 
句 歧义 性 缺陷 , 且 直 观 易 读 ,但 所 需 篇 幅 很 大 , 当 所 
要 描述 的 算法 流程 比较 复杂 时 ,使 用 起 来 就 不 太 EN 
方便 。 D) 

比较 实用 的 描述 算法 的 工具 是 伪 代 码 。 这 是 一 ”图 1-2 描述 线性 查找 算法 的 流程 图 
种 有 着 类 似 于 程序 设计 语言 的 严格 外 部 语法 (用 if- 
then-else 表示 分 支 结构 ,用 while-do 或 for-do 表示 循环 结构 ), 且 有 着 内 部 宽松 的 数学 语言 
表述 方式 的 代码 表示 方法 。 它 既 没有 歧义 性 的 缺陷 (严格 的 外 部 语法 ), 又 能 用 高 度 抽 象 的 
数学 语言 简练 描述 操作 细节 。 以 序列 的 线性 查找 算法 为 例 , 用 伪 代 码 描述 如 下 。 


LINEAR-SEARCH(A ,zx) 


1 n<-length[LA] Dn 表示 序列 A 中 元 素 个 数 
2i<1 DM A[1] 开 始 

3 while i<n 放逐 一 检测 A[ 门 的 值 是 否 等 于 x 
4 doif ALiJ=x 

5 then return i 上 > 若 存在 ALJ =x. WEA i 

6 isitl 

7 return —1 


算法 1-1 在 序列 A 中 查找 关键 值 为 z 的 元 素 的 线性 查找 过 程 LINEAR-SEARCH 
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算法 的 伪 代 码 表示 除了 上 述 的 无 歧义 及 抽象 表达 能 力 强 的 优势 以 外 ,有 一 个 其 他 方法 
无 可 比拟 的 优点 : 其 表达 形式 类 似 于 高 级 程序 设计 语言 代码 表达 形式 ,因此 更 便于 将 伪 代 
码 转换 为 程序 代码 。 本 书 此 后 均 用 伪 代 码 来 描述 算法 。 将 算法 描述 为 一 个 伪 代 码 过 程 的 其 
他 好 处 在 于 过 程 的 参数 往往 表示 出 了 待 解决 的 计算 问题 的 输入 ,而 过 程 的 返回 值 表 示 出 了 
该 计算 问题 的 输出 。 例 如 ,解决 在 序列 A 中 查找 关键 值 为 x 的 元 素 的 算法 LINEAR- 
SEARCH(A,z) 过 程 的 参数 A 和 zz 恰 为 该 问题 的 输入 ,而 在 过 程 中 第 6 行 返回 的 i 或 在 第 7 
行 返 回 的 一 1 恰 为 问题 的 输出 。 


11.3 伪 代码 的 使 用 约定 


CD 用 分 层 缩 进 来 指示 块 结构 。 例 如 ,从 第 2 行 开始 的 while 循环 的 循环 体 由 3 行 组 
成 ,分 层 缩 进 风格 也 应 用 于 if-then-else 语句 ,如 第 4 一 5 行 的 if-then 语句 。 使 用 分 层 缩 进 而 
不 是 传统 的 诸如 begin 和 end 语句 来 表示 块 结构 ,大 大 降低 了 混乱 ,提高 了 清晰 度 。 

(2) 循环 结构 while, for 和 repeat 以 及 条 件 结构 if then 和 else 具有 与 Pascal 相仿 的 解 
释 。 然 而 ,对 for 循环 却 有 一 点 点 不 同 : 在 Pascal 中 ,循环 计数 变量 的 值 在 退出 循环 后 是 没 
有 定义 的 ,但 在 本 书 里 ,循环 计数 器 在 退出 循环 后 仍然 保留 。 所 以 ,一 个 for 循环 刚 结束 时 ， 
循环 计数 器 的 值 首次 超过 for 循环 上 界 。 在 插入 排序 正确 性 的 讨论 中 就 用 到 了 这 一 特性 。 
for 循环 开头 是 for j4-2 to length[A], 所 以 当 此 循环 结束 时 ,j= 二 length[Aj 十 1( 或 等 价 地 ， 
j 二 n 十 1, 因 为 n=length[A])。 

G) 符号 少 表示 本 行 其 余部 分 是 注释 。 

(4) 多 重 赋值 形式 ij e 的 含义 是 变量 i 和 j 同 赋予 表达 式 。 的 值 , 它 应 当 被 理解 为 
在 赋值 操作 j<-e 之 后 紧 接着 赋值 操作 i<-j。 

(5) 变量 (如 ij 及 key ) 都 局 部 于 给 定 的 过 程 。 人 们 将 不 使 用 全 局 变量 除非 特别 声明 。 

(6) 数组 元 素 是 通过 数组 名 后 跟 插 在 方 括号 内 的 下 标 来 访问 。 例 如 ,A[ 门 表示 数组 
A 的 第 i 个 元 素 。 记 号 “.. ”用 来 表示 数组 中 取 值 的 范围 。 因 此 ,A[1.. 门 表示 A 由 A[1]、 
A[2]、…,ALjjj 个 元 素 构 成 的 子 序列 。 

CD 组 合 数据 通常 组 织 在 对 象 中 .其 中 组 合 了 若干 个 属性 或 域 。 用 域名 紧 跟 包括 在 方 
括号 中 的 对 象 名 来 访问 一 个 具体 的 域 。 例 如 ,把 一 个 数组 当成 一 个 对 象 , 它 具有 说 明 其 所 包 
含 的 元 素 个 数 的 属性 Length. length LA AGRIC. A 的 元 素 个 数 。 虽 然 对 数组 元 素 和 对 象 
属性 都 使 用 方 括号 ,通过 上 下 文 应 当 是 能 清楚 辨别 的 。 

表示 数组 或 对 象 的 变量 被 当成 一 个 指向 表示 数组 或 对 象 的 指针 。 对 一 个 对 象 zx 的 所 
AR f£. yz 将 导致 /[y] 二 /Lz]。 此 外 ,车 设 /Lxj<3, 则 不 仅 有 /Lz] 一 3, 且 有 flyl=3. 
换 句 话说 ,赋值 yer 后 ,x 和 y 指向 同一 个 对 象 。 

有 时 ,一 个 指针 不 指向 任何 对 象 ,此 时 ,给 它 一 个 特殊 的 值 NIL. 

(8) 过 程 的 参数 是 按 值 传递 的 。 被 调用 的 过 程 以 复制 的 方式 接受 参数 , 若 对 参数 赋值 ， 
则 主 调 过 程 不 能 看 到 这 一 变化 。 若 传递 的 是 一 个 对 象 , 则 指向 数据 的 指针 被 复制 ,但 对 象 的 
域 没 有 复制 。 例 如 , 若 z 是 一 个 被 调 过 程 的 参数 ,过 程 中 的 赋值 x* y 对 主 调 过 程 是 不 可 见 
的 。 但 是 ,赋值 f [xz]<3 却 是 可 见 的 。 

(9) 布尔 运算 符 and 和 or 都 是 短 回路 的 。 也 就 是 说 , 当 人 们 计算 表达 式 x and y 时 , 先 
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计算 z。 若 z 为 FALSE, 则 整个 表达 式 不 可 能 为 TRUE, 所 以 人 们 不 再 计算 y。 另 一 方面 ， 
E x H TRUE, 必须 计算 y 以 确定 整个 表达 式 的 值 。 类 似 地 ,在 表达 式 xz or y 中 ,计算 表达 
Xy MHM r 为 FALSE。 短 回路 操作 符 使 得 人 们 能 够 写 出 诸如 “zx 了 NIL and f[z]— y" 
这 样 的 布尔 表达 式 而 不 必 担 心 当 为 NIL 时 去 计算 flr] 


1.1.4 算法 分 析 


解决 同一 个 问题 ,算法 不 必 是 唯一 的 。 对 表示 问题 的 数据 的 不 同 的 组 织 方式 (数据 结 
构 ) ,解决 问题 不 同 的 策略 (算法 思想 ) 将 导致 不 同 的 算法 。 例 如 , 若 查找 问题 描述 如 下 。 

输入 : 7 个 数 构成 的 序列 A 三 一 aaz ott a, > EP a; Kai ,1 二 i<n; 特 定 值 xz。 

输出 : 若 序列 A 中 存在 元 素 , 其 值 等 于 z, 返 回 一 个 值 为 zx 的 元 素 在 序列 A 中 的 位 
置 一 一 下 标 。 和 否则 ,返回 一 1。 

可 以 用 如 下 的 算法 来 解决 这 一 问题 。 

BINARY-SEARCH(A,z) 

1 p-—l,.r--length[ A] 

2 while pr 

3 doq-lCG- 0/2] 
4 if A[q]—x 
5 then return q 
6 if A[q] 
7 then 57-431 
8 else r*-q9—1 
9 return —1 


算法 1-2 在 有 序 序列 A 中 查找 关键 值 为 x 的 元 素 的 二 分 查找 过 程 BINARY-SEARCH 


该 算法 利用 序列 A 的 有 序 性 ,从 p—1. rn 开始 ,考察 A 的 中 点 处 元 素 A[LCp 十 ”>)/2 Hig 
值 是 否 等 于 xz, 若是 , 则 g 就 是 所 要 求 的 下 标 值 。 否 则 , 若 该 值 小 于 xz, 则 丢弃 A[p..gj, 在 A 
[g 十 1. .rj 中 查找 (调整 p 为 q 十 1) , 若 该 值 大 于 z, 则 丢弃 ALg. .rj, 在 ALp..q 一 1j 中 继续 
查找 (调整 -为 4 一 1) 。 周 而 复 始 ,直至 por. WEA 中 无 元 素 的 值 等 于 xz ,返回 一 1。 

解决 同一 问题 的 不 同 的 算法 ,消耗 的 时 间 和 空间 资源 可 能 有 所 不 同 。 算 法 运行 所 需要 
的 计算 机 资源 的 量 称 为 算法 的 复杂 性 。 一 般 来 说 ,解决 同一 问题 的 算法 ,需要 的 资源 量 越 
少 , 人 们 认为 越 优 秀 。 计 算 算 法 运行 所 需 资源 量 的 过 程 称 为 算法 复杂 性 分 析 , 简 称 为 算法 分 
析 。 理 论 上 ,算法 分 析 既 要 计算 算法 的 时 间 复 杂 性 ,也 要 计算 它 的 空间 复杂 性 。 然 而 ,算法 
的 运行 时 间 都 是 消耗 在 已 存储 的 数据 处 理 上 的 ,从 这 个 意义 上 说 ,算法 的 空间 复杂 性 不 会 超 
过 时 间 复 杂 性 。 出 于 这 个 原因 ,人 们 多 关注 于 算法 的 时 间 复 杂 性 分 析 。 本 书 中 除非 特别 说 
明 ,所 说 的 算法 分 析 , 局 限于 对 算法 的 时 间 复 杂 性 分 析 。 

为 客观 、 科 学 地 评估 算法 的 时 间 复 杂 性 ,人 们 设置 一 台 抽象 的 计算 机 。 它 只 用 一 个 处 理 
机 , 却 有 无 限量 的 随机 存储 器 。 它 的 有 限 个 基本 操作 一 一 算术 运算 、 人 逻辑 运算 和 数据 的 移动 
(比如 对 变量 的 赋值 ) 均 在 有 限 固定 时 间 内 完成 ,人 们 进一步 假定 所 有 这 些 基本 操作 都 消耗 
一 个 时 间 单 位 , 称 此 抽象 计算 机 为 随机 访问 计算 机 , 简 记 为 RAM (Random Access 
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Machine)。 算 法 在 RAM 上 运行 时 所 需 的 时 间 ,显然 就 是 执行 基本 操作 的 次 数 。 不 难看 出 ， 
一 个 算法 的 时 间 复 杂 性 与 输入 的 规模 相关 ,一般 来 说 .规模 越 大 ,需要 执行 的 基本 操作 就 越 
多 ,当然 运行 时 间 就 越 长 。 例 如 ,在 对 列表 的 搜索 问题 的 算法 中 ,列表 所 含 元 素 个 数 (输入 规 
模 ) 越 大 ,所 花费 的 时 间 就 越 多 。 此 外 ,即使 问题 输入 的 规模 一 定 ,不 同 的 输入 ,也 会 导致 运 
行 时 间 的 不 同 。 很 多 文献 对 一 个 算法 的 运行 时 间 ,研究 如 下 3 种 情形 。 

CD 对 固定 的 输入 规模 ,使 得 运算 时 间 最 长 的 输入 所 消耗 的 运行 时 间 称 为 算法 的 最 坏 
情形 时 间 。 

(2) 对 固定 的 输入 规模 ,使 得 运行 时 间 最 短 的 输入 所 消耗 的 时 间 称 为 最 好 情形 时 间 。 

(3) 假定 对 固定 的 输入 规模 ,所 有 不 同 输入 构成 的 集合 为 D, ,对 问题 的 每 一 个 输入 
TED, ,车 已 知 该 输入 发 生 的 概率 为 PCD ,对 应 的 运行 时 间 为 (7D) ,运行 时 间 的 数学 期 望 值 
2 PODTCD 称 为 算法 的 平均 情形 时 间 。 
€ D, 


以 线性 查找 算法 1-1 为 例 ( 见 图 1- D ,这 个 算法 对 于 无 解 输入 ( 即 输入 的 线性 表 ALL. 0] 
中 不 存在 值 等 于 z 的 元 素 ), 所 消耗 的 时 间 最 长 ,因为 第 3 一 4 ATHY while 循环 需要 重复 检测 
nn 次 (也 就 是 要 做 次 迎 辑 运 算 )。 于 是 ,最 坏 情形 时 间 为 n。 

当 输 入 的 线性 表 中 第 一 个 元 素 A[1] 的 值 就 等 于 zx, 则 算法 仅 做 一 次 检测 就 可 返回 答 
案 。 这 是 最 好 的 情形 ,所 以 该 算法 的 最 好 情形 时 间 为 1。 

假定 第 一 个 值 等 于 z 的 元 素 等 概率 地 分 布 在 A[1. .nj 中 ,也 就 是 说 第 一 个 等 于 xz 的 元 
素 A[ 站 的 下 标 i 为 1,2,…,n 的 概率 均 为 1/2。 这 样 , 第 3 一 4 行 的 while 循环 要 做 i 次 检测 
的 概率 为 1/n。 所 以 算法 的 平均 情形 时 间 为 


>)P( 做 i 次 检测 ) Xi Dxi L» Lj nord). mdi 
i=l i=] i=] 


n 2 2 

显然 ,算法 的 最 好 情形 时 间 是 有 “欺骗 性 ”的 ,而 平均 情形 时 间 的 研究 要 用 到 概率 统计 的 
知识 。 算 法 最 坏 情形 时 间 可 视 为 算法 对 固定 输入 规模 的 运行 时 间 的 上 界 ,用 它 来 表示 算 
法 的 时 间 复 杂 性 是 合理 的 。 本 书 若 无 特殊 说 明 , 就 将 算法 的 最 坏 情 形 时 间 称 为 算法 的 运行 
时 间 。 把 算法 的 运行 时 间 记 为 工 ,输入 的 规模 记 为 n。 则 根据 以 上 说 明知 是 的 正 值 递 
增 函 数 ,以 T(n) 来 表示 算法 的 运行 时 间 。 

对 于 算法 1-2 中 描述 的 二 分 查找 而 言 , 最 坏 情 形 发 生 于 第 2 一 8 行 的 while 循环 没有 发 
生 第 5 行 的 return 命令 的 执行 。 这 样 该 循环 的 退出 是 由 于 循环 条 件 pr 的 不 满足 导致 的 。 
注意 ,循环 的 每 次 p 或 者 x 的 值 都 发 生 改变 ,使 得 pg 间 的 间距 都 是 原来 两 者 间距 的 一 半 。 
所 以 ,循环 的 次 数 为 lgn。 此 例 说 明 ,解决 问题 的 不 同 算法 ,运行 时 间 可 能 是 不 同 的 。 


11.5 算法 运行 时 间 的 渐 近 表示 


由 于 计算 机 技术 不 断 地 扩张 其 应 用 领域 ,所 要 解决 的 问题 输入 规模 也 越 来 越 大 ,所 以 对 
固定 的 来 计算 荆 (0) 的 意义 并 不 大 ,人 们 更 倾向 于 评估 当 ~c= 时 ,T(z) 赵 于 无 穷 大 的 快 
慢 来 分 析 算 法 的 时 间 复 杂 性 。 人 们 往往 用 几 个 定义 在 自然 数 集 N 上 的 正 值 函 数 了 (n): HE 
函数 ^ Ue 为 正 整 数 ) 对 数 宕 函数 Tm Oe 为 正 整数 ,在 算法 研究 领域 ,一 般 将 常用 对 数 lga 
的 底数 设置 为 2。 本 书 若 无 特 别 说 明 , 均 按 底 为 2 表示 常用 对 数 ) 和 指数 函数 a"(a 为 大 于 1 
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的 常数 ) 作 为 “标准 ”, 研 究 极限 : 
TD 
im — 一 人 
n Yo) 
EA 为 正常 数 , 人 们 称 YOO SE Td) HY TIE AIA SL RPK TGOWBESET Y G0 , 记 为 TG0— 
GC(YG) ,这 个 记号 称 为 算法 运行 时 间 的 渐 近 O- 记号 ,简称 为 9_ 记号。 例如 ,T(z) = 
32! 十 2 十 1, 由 于 


(1-1) 


TG) li 3n? +2n+1 
n? "x n? 


lim 340 


所 以 ,有 Tn) —900.Blb TGo EEF n, IEK, EAE nis TT) TGO P 28 NE 
最 高 次 项 以 外 的 所 有 项 ,上 且 忽略 最 高 次 项 的 常数 系数 ,就 可 得 到 它 的 渐 近 表达 式 @(Y(n))。 
用 此 方法 也 能 得 到 3x + 2n +1 =O’). 

如 果 两 个 算法 的 运行 时 间 的 渐 近 表达 式 相同 , 则 将 它们 视 为 具有 相同 的 时 间 复 杂 度 的 
算法 。 显 然 , 渐 近 时 间 为 对 数 寡 的 算法 优 于 渐 近 时 间 为 寡 函 数 的 算法 ,而 渐 近 时 间 为 寡 函 数 
的 算法 则 优 于 渐 近 时 间 为 指数 函数 的 算法 。 人 们 把 渐 近 时 间 为 寡 函 数 的 算法 称 为 具有 多 项 
式 时 间 的 算法 。 渐 近 时 间 不 超过 多 项 式 的 算法 称 为 有 效 的 算法 。 本 书 讨论 的 大 多 数 问题 都 
有 解决 它 的 有 效 算法 ,第 5 章 将 讨论 一 些 至 今 无 法 知道 其 是 否 有 “有 效 的 "算法 的 问题 ,这 些 
问题 导致 算法 研究 的 核心 问题 ,也 是 计算 机 科学 的 核心 问题 一 一 NP 难 问题 。 

渐 近 记号 除了 8 外 还 有 两 个 常用 的 O 记号 和 2 记号。 它们 的 粗略 意义 如 下 。 

考察 定义 域 为 自然 数 集 N 的 正 值 函 数 Y(n) 和 T(n) 构 成 的 极限 式 1-1 的 值 4, 车 4 宇 0 A 
4 为 一 常数 , 则 称 函 数 TOz) 渐 近 不 超过 函数 Y G0 i TG0 =O (YG00 5: A771. B. 4 为 常数 
或 为 十 co , 则 称 函 数 TOz) 渐 近 不 小 于 函数 Yn) AH TO) — (0). fl lg à —OG!) , IK 
Zant =en), WR, T= 0n 4AM To) =O Fm) A TO) —Q(YGD, 


1.2 数据 结构 


1.2.1 什么 是 数据 结构 


人 们 已 经 知道 计算 问题 有 明确 的 输入 和 输出 数据 ,算法 就 是 将 问题 的 输入 数据 转换 成 正 
确 的 输出 数据 的 操作 步骤 序列 。 在 数学 中 ,集合 是 表示 数据 的 最 基本 的 形式 。 相 应 地 ,在 计算 
科学 中 ,人 们 总 可 以 把 计算 问题 的 输入 输出 数据 表示 成 集合 。 于 是 ,如 何在 计算 机 中 表示 集合 
就 成 了 一 个 很 重要 的 问题 。 在 计算 机 中 表示 一 个 集合 有 两 个 方面 的 意义 : 其 一 ,集合 中 的 元 
素 之 间 有 什么 样 的 关系 ;其 二 ,在 计算 机 的 内 部 存储 器 中 如 何 存储 集合 中 的 各 个 元 素 。 关 于 集 
合 表示 的 这 两 个 方面 问题 的 研究 催生 出 了 一 门 重要 的 课程 一 一 数据 结构 。 简 单 地 说 ,数据 结 
构 就 是 研究 如 何在 计算 机 中 表示 一 个 集合 ,该 集合 中 的 元 素 间 有 着 某 种 特殊 关系 。 

例如 ,由 个 元 素 构成 的 集合 A ,将 元 素 排 成 一 列 {a ,as,…,a,)。 其 中 ,元 素 ai 没有 前 
驱 元 素 ,a, 没有 后 继 元 素 , 其 他 的 元 素 均 有 一 个 前 驱 元 素 和 一 个 后 继 元 素 , 这 样 的 集合 称 为 
一 个 线性 表 。 把 集合 的 元 素 按 某 种 关系 进行 组 织 , 称 为 数据 的 逻辑 结构 ,例如 ,线性 表 就 是 
一 种 逻辑 数据 结构 。 
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集合 的 逻辑 结构 除 线性 表 外 ,还 可 以 组 织 成 一 棵 二 叉 树 : 或 者 为 空 集 ,否则 集合 中 所 有 
元 素 中 只 有 一 个 元 素 没有 父 结 点 一 — 称 为 根 结 点 ,其 他 的 四 
元 素 (有 的 话 ) 有 且 仅 有 一 个 父 结 点 。 包 括 根 结 点 在 内 ,每 
个 结 点 至 多 有 两 个 孩子 结 点 。 没 有 孩子 的 结 点 称 为 树叶 结 
点 ,至 少 有 一 个 孩子 的 结 点 称 为 内 结 点 。 内 结 点 的 孩子 分 @) © 
成 左 孩子 和 右 孩子 。 例 如 ,图 13 表示 组 织 成 一 棵 二 又 树 的 
集合 {A,B,C,D,E,F})。 其 中 ,A RAS. DEFEN (0 — 09 (9 


结 点 ,A、B、C 都 是 内 结 点 。B、C 分 别 是 A 的 左 、 右 孩子 结 图 1-3 集合 {A,B,C,D,E,F} 
点 。B 的 左右 孩子 结 点 分 别 是 D A EC 只 有 左 孩 子 结 组 织 成 一 棵 二 叉 树 


可 以 利用 集合 的 线性 表 结构 和 二 叉 树 结构 组 合 构造 出 更 复杂 的 集合 迎 辑 结构 ,例如 ,将 
在 以 后 的 章节 中 看 到 的 图 的 邻接 矩阵 结构 和 邻接 表 结 构 就 是 线性 表 的 组 合 。 

具有 逻辑 结构 的 集合 在 内 存 中 的 存储 方式 , 称 为 数据 的 存储 结构 。 集 合 的 存储 结构 通 
常 分 为 连续 存储 结构 和 离散 存储 结构 两 种 。 连 续 存 储 指 的 是 将 内 存 中 的 一 片 空间 平均 分 成 
若干 彼此 相 邻 的 存储 单元 ,每 个 单元 存放 一 个 元 素 。 很 多 高 级 程序 设计 语言 (例如 C 语言 ) 
为 程序 员 提供 数组 ,这 种 数据 类 型 就 可 以 用 来 实现 集合 的 连续 存储 结构 。 例 如 ,用 数组 表示 
线性 表 , 元 素 的 下 标 刚好 表示 出 线性 表 中 元 素 间 的 前 驱 - 后 继 关 系 , 如 图 1-4 Ca) Bro o 

离散 存储 结构 指 的 是 集合 中 的 元 素 离散 地 存储 于 内 存 的 各 处 ,利用 指针 链接 方式 将 分 
散 存 储 的 各 元 素 按 其 逻辑 关系 连接 在 一 起 。 例 如 ,可 以 将 线性 表 表示 成 链表 ,如 图 1-4(b) 
所 示 。 同 样 地 ,表示 成 二 叉 树 的 集合 的 存储 结构 也 可 以 借助 数组 表示 为 连续 的 或 借助 于 指 
针 链 接 表 示 成 离散 的 。 这 些 正 是 本 书 第 2 章 要 展开 讨论 的 话题 。 


a, | a | a; | ay | as E d, 
Q 1 2 4 4 n-l 
(a) 
a, -| a, - a, — ol a, 


(b) 
图 1-4 线性 表 的 两 种 存储 结构 


1.2.2 数据 结构 对 算法 效率 的 影响 


数据 组 织 成 不 同 的 结构 ,是 为 了 适应 解决 不 同 的 问题 ,便于 算法 对 数据 的 操作 ,提高 算 
法 的 执行 效率 。 例 如 , 若 解决 一 个 问题 的 算法 中 要 频繁 地 随机 访问 线性 表 中 的 各 个 元 素 , 则 
线性 表 表示 成 数组 比 表示 成 链表 更 方便 ,这 是 因为 数组 中 的 元 素 可 以 按 其 下 标 方便 地 被 随 
机 访问 ,而 在 链表 中 访问 任何 结 点 都 必须 从 表 首 结 点 开始 顺序 访问 到 指定 结 点 。 另 一 方面 ， 
如 果 算 法 需要 在 线性 表 中 频繁 地 对 元 素 做 插入 、 删 除 操作 , 则 将 线性 表 表 示 成 链表 比较 合 
适 , 这 是 因为 在 数组 中 插入 或 删除 一 个 元 素 都 可 能 引起 大 量 元 素 的 移动 操作 ,而 在 链表 中 插 
和 人 或 删除 一 个 结 点 只 需要 对 个 别 结 点 的 链 域 做 改写 操作 。 
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数据 结构 的 不 同 选择 会 影响 算法 的 运行 效率 , 另 一 个 例子 是 考虑 在 具有 nn 个 元 素 的 集 
BA 中 查找 特定 的 值 为 x 的 元 素 问题 。 若 将 集合 A 表示 为 线性 表 , 则 人 们 看 到 算法 1-1 中 
的 LINEAR-SEARCH 过 程 的 运行 时 间 T(n) 二 8(n)。 而 将 A 表示 成 一 个 有 序 的 线性 表 , 则 
算法 1-2 中 的 BINARY-SEARCH 过 程 将 在 9(lgz) 时 间 内 运行 完成 。 表 面 上 看 ,算法 1-2 的 
运行 效率 比 算法 1-2 的 运行 效率 更 高 。 然 而 , 别 忘 了 要 将 集合 4 表示 成 有 序 的 线性 表 是 
需要 花 时 间 的 。 在 第 3 章 里 读者 将 看 到 任何 一 种 对 线性 表 的 排序 算法 至 少 要 用 OC) 
时 间 。 

另 一 方面 ,如 果 把 集合 A 表示 成 一 棵 二 叉 搜 索 树 , 二 叉 树 中 根 结 点 的 值 大 于 左 孩 子 中 
任何 结 点 的 值 ,同时 不 超过 右 孩 子 中 的 所 有 结 点 的 值 ,如 图 1-5 所 示 。 在 本 书 第 2 章 中 读者 
会 看 到 在 这 棵 树 中 查找 特定 值 zx 的 结 点 所 用 的 时 间 为 OUO ,其 中 为 数 的 高 度 。 当 nn 个 结 
点 的 二 叉 搜 索 树 为 平衡 树 时 , 树 高 hh 为 lgn。 图 1-6 展示 了 集合 A 二 {15,18,20,6,3,7,17， 
13,2,9,4} 表 示 成 如 图 1-5 这 样 二 又 搜索 树 后 在 其 中 查找 关键 值 x 二 9 的 元 素 的 操作 。 在 图 
中 可 看 到 ,为 完成 查找 ,zx 仅 与 4 个 结 点 的 数据 进行 了 比较 。 而 若 将 集合 A 表示 为 数组 , 则 
完成 同样 的 工作 需要 做 10 次 比较 。 更 进一步 说 , 若 能 将 集合 表示 成 一 棵 平衡 二 又 搜索 树 
(直观 地 看 ,就 是 根 的 左右 子 树 高 度 相 当 ), 在 A 中 查找 特定 值 为 x 的 结 点 真 的 可 以 
在 (lgn) 时 间 内 完成 。 


图 1-5 将 集合 {15,18,20,6,3,7,17,13,2,9,4} 组 织 成 一 棵 二 叉 搜 索 树 


图 1-6 所 示 为 在 二 又 搜索 树 中 查找 。 图 1-6(a) 中 ,集合 A=={15,18,20,6,3,7,17,13， 
2,9,4} 表 示 成 一 棵 二 又 搜索 树 ,关键 值 z= 二 9。 图 1-6(b) 中 ,z 与 根 15 比较 ,小 于 根 ,将 在 左 
子 树 中 继续 查找 。 图 1-6(c) 中 ,z 比 树 根 6 大 ,将 继续 在 右 子 树 中 查找 。 图 1-6(d) 中 ,zx E 
树 根 7 大 ,将 继续 在 右 子 树 中 查找 。 图 1-6 Ce) 中 ,z 小 于 树 根 13 ,将 继续 在 左 子 树 中 查找 。 
图 1-6CD B ,找到 关键 值 为 9 的 元 素 。 


1.2.3 字典 与 字典 操作 


如 1.2.2 节 所 述 , 研 究 数据 集合 的 逻辑 结构 和 存储 结构 的 主要 目标 就 是 如 何 表示 计算 
问题 的 输入 输出 数据 ,使 得 解决 该 问题 的 算法 效率 更 高 (运行 得 更 快 )。 人 们 在 长 期 的 算法 
研究 中 发 现 , 很 多 算法 都 是 以 下 列 的 对 数据 集合 的 操作 作为 对 数据 的 基本 处 理 的 。 

KS 为 具有 7 个 数据 元 素 的 集合 。 
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图 1-6 在 二 叉 搜索 树 中 查找 


INSERT(S,z) ,在 集合 S 中 插入 关键 值 为 zx 的 数据 元 素 , 即 S< S Ur). 

SEARCH(S,z) ,在 集合 S 中 查找 关键 值 为 x 的 数据 元 素 , 即 判断 是 否 zxES。 

DELETE(S,z) ,在 集合 S 中 删 掉 元 素 z. 即 S--S— (c). 

ER 3 个 对 集合 的 操作 称 为 字典 操作 .实现 了 字典 操作 的 集合 简称 为 字典 。 字 典 在 很 
多 应 用 问题 中 都 是 重要 的 数据 集合 表示 。 例 如 ,个 人 通讯 录 、 仓 库 物 品 清单 .单位 员工 信息 
表 等 。 一 个 算法 中 往往 以 字典 操作 作为 基础 操作 ,组 合成 更 复杂 的 操作 ,来 获得 计算 结果 。 
本 书 第 2 章 将 讨论 几 个 典型 的 字典 : 线性 表 、 二 叉 搜 索 树 、 散 列表 等 。 除 此 之 外 ,第 2 章 中 
还 将 讨论 插入 .删除 操作 限制 在 线性 表 的 某 一 端的 数据 结构 一 一 栈 和 队列 ,以 及 便于 访问 全 
序 集合 中 最 大 /最 小 元 素 的 数据 结构 一 一 优先 队列 等 。 本 书后 面 各 章 将 运用 这 些 数 据 结 构 
设计 解决 各 种 计算 问题 的 算法 ,并 用 C 程序 设计 语言 将 其 实现 为 可 运行 的 程序 。 此 外 ,在 
必要 的 时 候 , 还 会 介绍 其 他 有 用 的 数据 结构 。 
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1.3 程序 设计 
1.3.1 算法 与 程序 


用 计算 机 解决 计算 问题 ,在 理解 了 问题 本 身 , 选 择 好 了 合适 方式 表示 出 输入 输出 数据 ， 
并 设计 好 了 正确 的 算法 后 , 接 下 来 就 要 考虑 如 何 将 算法 实现 为 计算 机 能 够 运行 的 程序 。 计 
算 机 程序 就 是 用 一 种 计算 机 程序 设计 语言 ,将 算法 表示 成 计算 机 能 执行 的 数据 操作 指令 序 
列 。 计 算 机 技术 发 展 到 今天 ,曾经 投入 使 用 的 程序 设计 语言 不 下 千 种 ,即使 是 目前 流行 的 程 
序 设 计 语 言 至 少 也 有 数 十 种 ,这 些 语言 有 着 各 自 的 技术 特色 ,适应 于 各 种 类 型 的 应 用 。 用 什 
么 语言 来 实现 算法 ,并 没有 一 个 明确 的 答案 ,这 取决 于 算法 所 解决 的 问题 性 质 、 实 现 算法 所 
需要 的 技术 特点 以 及 程序 员 对 语言 的 熟悉 程度 。C 语言 是 当今 软件 开发 领域 最 热门 的 语 
言 , 掌 握 C 语言 几乎 成 了 跨 和 人 程序 员 门 槛 的 必 经 之 路 。 本 书 即 以 C 语言 为 工具 ,深入 讨论 
算法 的 程序 实现 ,向 读者 展示 它 的 魅力 ,从 中 领悟 程序 设计 的 规律 ,体验 程序 设计 成 功 的 
愉悦 。 

作为 例子 ,我 们 用 C 语言 来 实现 在 表示 为 数组 的 线性 表 A 中 查找 特定 关键 值 x 元 素 的 
算法 LINEAR-SEARCH(A,z) 算 法 过 程 。 在 C 语言 中 ,往往 把 实现 某 一 功能 的 子 程序 写成 一 
个 函数 。 


1 int linearSearch(int * a.int n.int x){ 


2 int i=0; 

3 whileCi 一 n){ / * T£ a[0.. n—1] PH « / 

4 if(ali]==x) /* 找到 关键 值 为 x 的 元 素 ,其 下 标 为 ix / 
5 return i; 

6 i++; 

7 ) 

8 return —1; /* 未 找到 关键 值 为 x 的 元 素 * / 

9) 


程序 1-1 实现 算法 1-1 的 C 源 代码 文件 search. c 


尽管 程序 1-1 中 的 C 代码 与 算法 1-1 中 的 伪 代 码 十 分 相似 ,但 要 强调 的 是 用 伪 代 码 描 
述 的 算法 并 不 等 同 于 程序 。 这 主要 出 于 如 下 几 个 原因 。 

(1) 算法 的 伪 代 码 描述 着 眼 于 算法 思想 的 简明 阑 述 , 高 度 抽象 是 它 的 最 基本 的 特征 之 
一 。 例 如 ,在 伪 代 码 中 可 以 用 求 和 符号 py" 简约 地 表示 序列 二 mi ,zs，… en, > RAG SAG 
起 来 的 元 素 集合 强调 元 素 的 位 置 顺序 , 花 括 号 括 起 来 的 元 素 集合 表示 一 般 的 元 素 集合 ) 的 
累加 ;而 在 程序 中 ,也 许 就 要 用 一 个 循环 结构 来 表示 这 个 累加 过 程 。 

(2) 算法 的 伪 代 码 描述 有 时 并 不 关心 数据 的 存储 格式 。 例 如 ,在 算法 1-1 中 无 须 说 明 
序列 二 a ,as,…,a, 记 是 存储 在 一 个 数组 中 还 是 存储 在 一 个 链表 中 ,这 在 程序 中 却 是 必须 明 
确 声明 的 。 
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(3) 算法 伪 代 码 描述 对 变量 无 须 事先 声明 ,只 要 在 上 下 文中 能 识别 各 变量 及 其 用 途 就 
可 以 了 ;而 在 选用 的 C 语言 中 所 有 的 变量 都 必须 先 定义 后 使 用 。 

可 见 ,算法 伪 代 码 描述 是 写 给 人 看 的 , 它 是 人 们 用 来 设计 程序 的 蓝图 ;而 实现 算法 的 程 
序 是 按 设计 蓝图 施工 而 得 到 的 成 品 ,是 写 出 来 让 机 器 运行 的 。 

将 算法 的 伪 代 码 过 程 实现 为 程序 中 的 函数 需要 仔细 考虑 如 下 3 个 要 点 。 

(1) 参数 与 返回 值 。 伪 代码 过 程 的 参数 反映 了 待 解决 的 计算 问题 的 输入 ,而 过 程 可 能 
的 返回 值 ,表示 该 问题 的 输出 。 对 于 实现 算法 过 程 的 函数 而 言 ,必须 考虑 要 用 多 少 个 参数 表 
示 算 法 过 程 的 各 个 参数 (程序 中 可 能 需要 多 个 参数 表示 算法 中 的 一 个 参数 )。 它 们 各 自 是 什 
么 类 型 的 ? 需要 返回 多 少 个 数据 ,这 些 数据 类 型 如 何 ? 例如 ,实现 算法 1-1 的 程序 1-1, 函 数 
名 与 算法 的 过 程 名 相同 ,参数 int * a 和 int n 表示 算法 过 程 的 参数 序列 A, SR int x 表示 
算法 过 程 的 参数 x。 这 实际 上 是 将 序列 A 限制 为 由 整 型 元 素 构成 用 数组 存储 (int 型 指针 
* a 表示 数 组 的 首 元 素 地 址 ,参数 int n 表示 存储 于 该 数组 的 元 素 个 数 ,此 即 为 需要 多 个 参 
数 表示 算法 过 程 的 一 个 参数 的 一 个 实例 ) 的 线性 表 。 当 然 待 查找 的 关键 值 x 也 限制 为 整 型 
数据 了 。 至 于 函数 的 返回 值 与 算法 过 程 是 保持 一 致 的 ,都 是 整 型 值 (第 5 行 的 retun i 和 第 8 
行 的 return 一 1 对 应 算法 1-1 中 的 第 5 行 和 第 7 行 ), 因 此 该 函数 的 返回 值 类 型 为 int。 

(2) 数据 设置 。 由 于 C 语言 中 对 所 有 的 变量 必须 先 定义 后 使 用 ,所 以 要 考察 算法 过 程 
中 所 需要 访问 的 所 有 数据 变量 ,对 每 个 变量 考虑 它 的 数据 类 型 .存储 类 型 .访问 限制 和 初始 
值 等 。 例 如 ,在 算法 1-1 中 需要 变量 i 表示 扫描 序列 元 素 时 的 下 标 , 所 以 程序 1-1 的 第 2 行 
定义 了 对 应 的 整 型 变量 i 且 初始 化 为 0。 

(3) 关键 代码 。 前 面谈 到 , 伪 代 码 的 表述 可 以 是 很 简约 的 ,其 抽象 程度 可 能 是 目前 的 程 
序 设计 语言 所 不 能 企及 的 ,这 就 需要 用 程序 设计 语言 提供 的 技术 来 为 计算 机 将 这 些 伪 代 码 
的 抽象 描述 解释 为 计算 机 可 理解 的 语句 或 表达 式 。 此 外 , 伪 代 码 与 程序 代码 之 间 有 着 一 些 
微妙 的 区 别 。 

CD 伪 代 码 中 序列 的 下 标 往往 从 1 开始 编号 ,而 C 语言 中 ,数组 的 元 素 下 标 是 从 0 开始 
编号 的 。 

© 伪 代 码 中 变量 的 赋值 符号 一 明确 地 表示 出 了 赋值 操作 的 方向 性 ,而 在 C 语言 中 使 用 
运算 符 王 表示 赋值 运算 。 

© 在 C 语 言 中 有 一 套 极 具 特 色 的 运算 符 , 即 自 增 / 自 减 运算 符 。 用 i 十 十 (或 十 十 D 表 
示 i<-i 十 1,i 一 一 (或 一 一 站 表示 ieil. 

所 有 这 些 , 都 必须 在 实现 代码 中 一 一 体现 。 


1.3.2 数据 类 型 的 抽象 与 代码 通用 性 


其 实 ,程序 1-1 并 不 是 对 算法 1-1 的 彻底 实现 。 这 是 因为 算法 1-1 中 ,对 线性 表 A 中 元 
素 的 类 型 没有 任何 限制 ,而 程序 1-1 却 将 其 限制 为 整 型 数组 。 这样, 如果 要 在 一 个 浮 点 型 数 
组 中 查找 特定 关键 值 就 必须 重 写 这 个 函数 将 其 中 的 参数 a 和 x 的 类 型 进行 变换 。 这 样 对 不 
同 的 类 型 都 需要 重 写 这 个 函数 ,将 导致 巨大 的 代码 量 和 更 多 重复 劳动 。 此 外 ,在 C 语言 中 
还 要 避免 这 些 函 数 的 同名 冲突 (相信 读者 初 识 C 时 都 遭遇 过 对 abs 函数 和 fabs 函数 的 困 
惑 )。 令 代码 具有 通用 性 ,使 其 尽 可 能 地 适用 于 各 种 可 能 的 场合 ,是 优秀 程序 员 的 追求 。 将 
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要 处 理 的 数据 类 型 加 以 抽象 ,使 其 适用 于 不 同类 型 的 数据 ,是 提高 代码 通用 性 的 重要 手段 。 
各 种 语言 抽象 数据 类 型 的 所 用 的 技术 特点 是 有 所 不 同 的 。 就 实现 算法 1-1 为 例 ,讨论 C 语 
言 对 数据 类 型 抽象 的 方法 。 

C 语言 数据 抽象 的 利器 void 型 指针 

C 语言 数据 类 型 的 抽象 工具 是 void 型 指针 。void 型 指针 可 以 指向 存放 任何 类 型 数据 
的 内 存单 元 (组 )。 利 用 这 一 特性 ,用 一 个 void 型 指针 表示 一 个 抽象 元 素 类 型 的 数组 首 元 素 
地 址 ,同时 将 特定 关键 值 存放 在 一 个 变量 中 并 将 该 变量 的 地 址 作为 一 个 void 型 指针 传递 给 
函数 。 这 样 , 似 乎 可 将 程序 1-1 中 的 C 函数 的 原型 声明 改写 成 : 

int linearSearch(void * a,int n,void * x); 
然而 ,事情 并 没有 那么 简单 : 由 于 函数 linearSearch 调用 时 传递 给 它 的 实际 参数 a 中 元 素 的 
类 型 编译 程序 并 不 知道 ,所 以 如 何 用 下 标 确 定 a 中 元 素 的 地 址 还 需要 补充 一 点 信息 一 一 数 
组 中 每 个 元 素 的 存储 宽度 。 这 可 以 利用 参数 向 函数 linearSearch 传递 这 一 信息 ,于 是 函数 
linearSearch 的 原型 声明 写成 ， 


int linearSearch(void * a,int size,int nyvoid * x); 
其 中 ,第 二 个 参数 size 表示 存储 在 数组 a 中 的 元 素 的 存储 宽度 的 。 这 样 ,就 可 通过 地 址 a 十 
ix size 访 问 数组 a 中 的 第 i 个 元 素 。 然 而 ,这 样 还 不 够 ,由 于 算法 需要 依次 比较 数组 元 素 与 
特定 值 是 否 相等 ,而 编译 程序 对 两 个 void 型 指针 a 十 i x size 和 x 指向 的 内 存 中 的 数据 无 法 
执行 比较 运算 ,所 以 调用 函数 linearSearch 时 必须 告诉 它 ,如 何 比较 数组 中 的 元 素 与 x 指向 
的 数据 。 这 必须 通过 一 个 比较 函数 来 完成 .可 以 通过 函数 指针 参数 ,把 这 一 比较 规则 告诉 函 
数 linearSearch。 于 是 函数 linearSearch 写成 : 


1 int linearSearch(void * a,int size,int n,void * x,int( * comp) (void * ,void * )) { 


2 int i—0; 

3 while(i<n) { 

4 if(comp((char * )a+i * size,x) 一 一 0) /* SHft-F aliJ==x) */ 

5 return i; /* 找到 关键 值 为 x 的 元 素 ,其 下 标 为 ix / 
6 itt; 

7 ) 

8 return —1; /* 未 找到 关键 值 为 x 的 元 素 * / 

9) 


程序 1-2 ”实现 算法 1-1 在 数组 中 查找 元 素 的 通用 C 代码 


为 便于 代码 重用 ,将 程序 1-1 的 源 代码 文件 search.c 连 同 声明 函数 linearSearch 的 头 
文件 search. h 存放 在 utility 文件 夹 中 。 

该 函数 的 实现 要 点 中 的 第 1 点 参数 与 返回 值 已 经 在 前 面 讨论 过 了 ,第 2 点 数据 设置 与 
程序 1-1 中 的 一 样 。 此 处 ,重点 讨论 第 3 点 : 关键 代码 。 比 较 程 序 1-1 与 程序 1-2 的 函数 体 
可 以 发 现 , 两 者 只 有 第 4 行 中 证 语句 中 的 条 件 表 达 式 有 所 不 同 。 在 程序 1-1 中 ,该 分 支 语句 
的 条 件 表 达 式 为 a[ 订 = 王 x, 而 在 程序 1-2 中 表达 式 为 comp(a 十 ix size,x) 一 一 0, 比 较 两 者 
可 见 comp(a+i * sizeyx) 一 一 0 HALT a[i]— —x. comp 是 由 参数 传递 进来 的 函数 指针 , 它 
是 指向 一 个 具有 两 个 void 型 指针 参数 且 返 回 值 为 整数 的 函数 的 指针 。 我 们 约定 : 若 第 一 个 
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指针 指向 的 数据 大 于 第 二 个 指针 指向 的 数据 ,该 函数 返回 一 个 大 于 0 的 整数 ; 若 第 一 个 指针 
指向 的 数据 小 于 第 二 个 指针 指向 的 数据 ,该 函数 返回 一 个 小 于 0 的 整数 ;而 当 两 个 指针 指向 的 
数据 相等 时 ,该 函数 返回 0。 按 此 约定 ,条 件 ai 二 一 x 就 等 价 于 comp(a 十 ix size,x) 二 三 0。 

可 以 对 需要 比较 的 数据 类 型 事先 定义 好 各 自 的 比较 函数 ,例如 ,下 列 代码 就 定义 了 比较 
两 个 由 指针 指向 的 整 型 ,字符 型 单 精 度 浮 点 型 和 双 精 度 浮 点 型 数据 的 函数 。 


1 int intGreater(int * x,int * y){ / * 比较 两 个 int 指针 指向 的 整 型 数据 * / 

2 return (* x)—( * y); 

3} 

4 int charGreater(char * x,char * y){ / * 比较 两 个 char 指针 指向 的 字符 型 数据 x / 
5 return ( * x)—( * y); 

6 } 

7 int floatGreater(float * x,float * y)( / * 比较 两 个 float 指针 指向 的 单 精度 浮 点 数据 * / 
8 if(( * x— * y)>0. 0) 

9 return 1; 

10 if(( * x— * y)<0. 0) 

11 return —1; 

12 return 0; 

13 } 


14 int doubleGreater(double * x,double * y) ( / * 比较 两 个 double 指针 指向 的 双 精 度 浮 点 数据 * / 
15 — if((*x— * y)>0. 0) 


16 return l; 

17 if(( * x— * y) 0.0 
18 return —1; 

19 return 0; 

20) 


程序 1-3 用 两 个 指针 指向 的 数据 的 比较 函数 


利用 这 些 比较 函数 ,就 可 以 调用 linearSearch 在 各 种 类 型 的 数据 中 查找 特定 值 了 。 例 
如 , 设 a 为 double 型 数组 ,有 nm 个 元 素 , 变 量 x 中 存 有 double 型 数据 ,调用 程序 1-2 中 的 
linearSearch 函数 在 a 中 查找 x, 调 用 形式 为 


linearSearch(a, sizeof(double) ,n, &-x,doubleGreater) ; 
车 数组 a 的 元 素 类 型 和 变量 x 的 类 型 为 char, 则 调用 形式 应 为 
linearSearch(a, sizeof(char) n» &x,charGreater) ; 


为 便于 代码 重用 ,将 上 述 程序 1-3 存储 为 utility 文件 夹 中 的 源 文件 compare. c, 并 将 这 
些 函数 的 声明 存储 到 同一 文件 夹 内 的 头 文件 compare. h 中 。 


1.4 数据 的 输入 输出 


1.4.1 应 用 问题 


本 节 用 上 述 实现 的 查找 函数 解决 如 下 问题 。 
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搜索 引擎 


问题 描述 

Internet 以 海量 信息 供用 户 查 询 而 得 到 广泛 应 用 。 各 大 门户 网 站 取胜 的 法 宝 之 一 就 
是 强大 的 搜索 引擎 。 搜 索引 擎 用 用 户 输入 的 关键 值 在 大 量 的 数据 中 查找 相关 信息 。 从 
某 种 意义 上 说 ,前 面 实现 的 LINEAR-SEARCH 算法 也 是 一 个 “搜索 引擎 ”, 它 可 以 在 一 个 存 
储 了 很 多 信息 的 线性 表 中 查找 特定 的 关键 值 。 对 待 每 一 个 搜索 任务 一 一 个 关键 值 x 和 
一 组 数据 ALp. .qj, 若 A 中 有 与 x 相关 的 信息 , 则 返回 信息 在 表 中 的 位 置 ,否则 给 出 “未 
找到 ”信息 。 

输入 

输入 文件 inputdata. txt 中 记录 了 若干 个 搜索 任务 ,每 个 任务 表示 成 两 行 ,第 一 行 有 两 
个 数据 项 : 第 一 个 是 一 个 字符 : IUe S Ds ?分 别 表示 关键 值 的 类 型 为 整数 .字符 、 浮 点 
数 和 字符 串 ; 第 二 个 是 对 应 类 型 的 关键 值 。 第 二 行 包 括 若干 个 (最 多 不 超过 80 个 ) 对 应 类 型 
的 数据 ,数据 项 之 间 用 一 个 空格 隔 开 。 

输出 

输入 文件 中 的 每 一 个 搜索 任务 ,对 应 输出 文件 outputdata. txt 中 的 一 行 信息 : 若 数据 
表 中 有 待 查 的 信息 , 则 输出 关键 值 在 数据 表 中 的 位 置 ,否则 输出 信息 “not found". 

输入 样 例 


i 35 

2 9 24 35 78 56 90 

{12.0 

20 32. 1 27 0. 35 12 24 

ch 

abcdefghijklmnopqrstuvwxyz 

s Beijing 

Beijing Aomen Xianggang Chongqing Tianjin Shanghai 
i10 

0123456789 


输出 样 例 
4 
5 
8 
1 


not found! 


问题 分 析 

由 于 输入 文件 中 对 应 每 个 搜索 任务 的 数据 项 多 少 不 一 ,解决 这 个 问题 的 思路 是 按 行 读 
取 输 入 文件 的 数据 ,每 个 搜索 任务 读 取 两 次 : 读 取 的 第 一 行 包含 数据 类 型 信息 Ly pe 和 查找 
关键 值 hey ,根据 数据 类 型 cy pe 设法 将 包含 于 第 二 行 中 的 若干 该 类 型 的 数据 存放 到 一 个 数 
组 A[1..xj 中 ,然后 调用 过 程 LINEAR-SEARCH 在 A 中 查找 key ,车 返回 值 一 0, 将 ;作为 一 
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行 写 进 输出 文件 ,否则 在 输出 文件 中 写 和 一行 “not found!”。 往 返 重复 ,直至 输入 文件 结 
东 。 算 法 用 伪 代 码 表示 如 下 。 


SEARCH-ENGINE( fi + f2) b fi BA ASHE fo 表示 输出 文件 
1 打开 输入 文件 fi 

2 打开 输出 文件 fe 

3 while not end of f; 

4 do firststr-—M f, 读 入 一 行文 本 

type) _Firststr 提取 第 一 个 字符 

key<- 按 type 指定 的 类 型 从 first-str BRK BA 
second-str«- 从 fi 读 入 一 行文 本 
i<-SEARCH(key, second^str ) 

if i>0 

10 then 将 i 作为 一 行 写 人 f; 

11 else 将 'hot found! YE — £18 A. fo 

12 关闭 文件 f. 

13 关闭 文件 fo 


算法 1-3 解决 搜索 引擎 问题 的 算法 SEARCH-ENGINE WE 


€ 0 3 O0 wm 


SEARCH (keys second-str ) 

1n+0 

2 while second-str 中 还 有 数据 

3 do x< MM second-str 中 提取 一 项 数据 
4 nnl 

5 A[n]-7x 

6 return LINEAR-SEARCH(A 1 n key) 


算法 1-4 算法 过 程 SEARCH-ENGINE 中 调用 的 SEARCH 过 程 


解决 本 问题 的 算法 很 简单 ,但 是 实现 算法 会 遇 到 如 下 的 问题 : 输入 数据 中 每 一 个 搜索 
任务 类 型 并 不 统一 ,所 含 的 数据 个 数 也 不 统一 。 换 句 话 说 , 读 取 文件 的 操作 需 有 针对 不 同 数 
据 类 型 和 数据 量 的 灵活 性 。 


1.4.2 标准 输入 输出 


C 语言 将 所 有 与 程序 外 的 数据 交流 统一 视 为 "数据 流 ”, 程 序 外 承载 数据 的 集合 统称 为 
“文件 ”。 计 算 机 系统 有 两 个 特殊 的 文件 : 键盘 一 一 标准 输入 文件 .屏幕 一 一 标准 输出 文件 。 
本 节 以 解决 “搜索 引擎 "问题 为 例 , 说 明 数 据 输 入 输出 技术 ,包括 标准 输入 输出 文件 和 磁盘 文 
件 的 输入 输出 操作 。 

C 语言 的 头 文件 stdio. h 中 声明 了 若干 个 用 于 读 写 标准 输入 输出 文件 的 库 函 数 ,如 表 1-1 
所 示 。 
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Rll 用 于 读 写 标准 输入 输出 文件 的 库 函 数 
E —H 解 — 


格式 串 中 包含 若干 个 格式 符 一 一 以 % 引 导 的 表示 数据 输入 格式 的 
scanf( 格 式 串 ,变量 地 址 表 ) 符号 ,格式 符 与 变量 地 址 表 中 的 项 一 一 对 应 ,在 键盘 上 接受 对 各 变 
量 输 入 指定 格式 (类 型 ) 的 数据 


格式 串 包含 车 干 个 格式 符 ,格式 符 与 表达 式 表 中 的 项 一 一 对 应 ,将 
各 表达 式 按 指定 格式 (类 型 ) 依 次 向 屏幕 输出 


printf( 格 式 串 ,表达 式 表 ) 


getchar() 在 键盘 上 接受 一 个 字符 的 输入 并 作为 返回 值 返回 

puchar( 字 符 表达 式 ) 将 作为 参数 的 字符 表达 式 的 值 输出 到 屏幕 上 

getsO 在 键盘 上 接受 一 行 字符 的 输入 并 将 其 作为 一 个 字符 串 返 回 
puts( 串 表达 式 ) 将 作为 参数 的 字符 串 表 达 式 作为 一 行 输出 到 屏幕 


利用 表 1-1 中 罗列 的 各 库 函 数 还 不 足以 解决 本 问题 ,因为 当 用 gets 从 键盘 上 接受 一 行 
文本 后 ,对 如 何 从 中 正确 提取 信息 C 语言 提供 了 读 取 包 含 于 该 文本 行 中 的 数据 的 库 函 数 ， 
如 表 1-2 所 示 。 

R12 C 语 言 用 于 串 输入 输出 操作 的 西数 
函 ou 名 解 RR 
sscanf( 文 本 串 ,格式 串 , 变 量 地 址 表 ) 从 文本 串 中 接受 对 各 变量 输入 指定 格式 (类 型 ) 的 数据 
sprintf( 缓 冲 区 串 ,格式 串 , 表 达 式 表 ) 将 各 表达 式 按 指定 格式 (类 型 ) 依 次 向 缓冲 区 串 输出 


然而 ,用 sscanf 从 一 个 文本 串 中 连续 读 取 多 个 数据 必须 一 次 性 传递 指定 个 数 的 变量 地 
址 而 不 能 通过 每 次 读 取 一 个 多 次 循环 重复 来 实现 ,因为 每 次 重复 ,sscanf 都 将 从 文本 中 的 首 
地 址 开始 读 取 数 据 。 这 给 编程 带 来 了 困难 : 编程 时 可 能 并 不 知道 需要 在 文本 行 中 读 取 多 少 
个 数据 。 于 是 , 需 对 sscanf 进行 一 次 拓展 ,定义 如 下 的 串 输入 流 类 型 ,并 且 声 明 对 串 输 入 对 
象 的 常用 操作 函数 。 


1 typedef struct{ 


2 char * begin; /* 输 入 流 首 地 址 * / 

3 char* current; /* 输 入 流 当前 读 取 位 置 */ 

4 }StrInputStreamy /* 串 输入 流 * / 

5 void initStrInputStream(StrInputStream * „char * ); /* 初 始 化 输入 流 * / 

6 void sisRewind(StrInputStream * ); /* 输 入 流 还 原初 始 设置 * / 

7 int sisEof(StrInputStream * ) ; / x 检测 输入 流 是 否 结束 * / 

8 int readInt(StrInputStream * ,int * ) ; /* 从 输入 流 中 读 取 整数 */ 

9 int readDouble(StrInputStream * ,double * ) ; / * 从 输入 流 中 读 取 双 精度 浮 点 数 * / 
10 int readChar(StrInputStream * ,char * ) ; / * 从 输入 流 中 读 取 字符 * / 

11 int readString(StrInputStream * ,char * ); / * 从 输入 流 中 读 取 字 符 串 * / 


程序 1-4 ” 串 输入 流 类 型 定义 以 及 串 输入 流 操作 函数 的 声明 
对 程序 1-4 的 说 明 如 下 。 
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CD 第 1 一 4 行 定义 的 是 串 输入 流 StrInputStream。 它 含有 两 个 字符 型 指针 属性 : 
begin 和 current, 分 别 指向 串 流 首 和 当前 读 取 数 据 的 位 置 。 

(2) 第 5 一 7 行 分 别 声明 了 用 来 初始 化 输入 流 、 还 原 输 入 流 初 始 状态 、 判 别 输入 流 是 否 
为 空 的 常规 维护 函数 initStrInputStream sisRewind, sisEof 。 

G) 第 8 一 11 行 声 明了 用 来 从 输入 流 中 读 取 整 型 数据 函数 readInt、 读 取 浮 点 型 数据 函 
数 readDouble, 读 取 字 符 型 数据 函数 readChar 和 读 取 字符 串 数据 函数 readString。 

为 便于 代码 重用 ,将 程序 第 1 一 4 行 中 的 代码 保存 在 utility 文件 夹 中 的 头 文件 
strstream .h 中 。 


下 面 定 义 程 序 1-4 中 声明 的 各 函数 。 
1， 串 输入 流 的 常规 维护 


用 来 创建 串 输入 流 、 判 断 输 入 流 是 否 为 空 及 恢复 输入 流 初 始 状态 的 常规 维护 操作 函数 
定义 如 下 。 


1 void initStrInputStream(StrInputStream * ssin,char* s){ /x* 初 始 化 输入 流 */ 


2 while( * s=='"'|| * s 一 一 At) /* 掠 过 空格 */ 
3 st: 
4 ssin-»begin— ssin-»current— s; 
5} 
6 int sisEof(StrInputStream * ssin) { 
7 return (strlen(ssin-»current) = =0) || ( * (ssin->current) = —^r' || 
C * (ssin-> current) — —^n)); 
8) 
9 void sisRewind(StrInputStream * ssin) { / * 还 原 输入 流 的 初始 状态 * / 
10 ssin-»current— ssin-»begin; 
11) 


程序 1-5 定义 串 输 入 流 常 规 维护 操作 函数 的 C 代码 


对 程序 1-5 的 说 明 如 下 。 

(1) 第 1 一 5 行 定 义 的 函数 initStrInputStream 用 串 参数 s 创建 一 个 StrInputStream 对 象 
ssin。 假 定 输入 流 中 的 数据 项 之 间 用 空格 作为 分 隔 符 。 初 始 时 ,作为 流 载 体 的 串 可 能 存在 前 导 
空格 ,这 会 影响 数据 的 正确 读 出 ,于 是 第 2 一 3 行 的 while 循环 负责 掠 过 前 导 空格 ,第 4 行将 串 
输入 流 的 起 始 指针 begin 和 当前 读 取 指 针 current 初始 化 为 掠 过 了 前 导 空 格 后 的 串 so 

(2) 第 6 一 8 行 定 义 的 函数 sisEof, 通 过 检测 串 输入 流 参数 ssin 中 current 指向 的 串 是 
和 否 为 空 ( 串 长 度 为 0) 或 current 指向 的 字符 为 回 车 或 换行 符 来 判定 串 输 入 流 是 否 为 空 。 若 
串 输入 流 ssin 为 空 返回 1 ,否则 返回 0。 

(3) 第 9 一 11 行 定义 的 函数 sisRewind, 通 过 将 串 输入 流 参 数 ssin 中 的 current 指针 赋 
值 为 begin, 来 恢复 输入 流 的 初始 状态 。 


2. 从 串 输入 流 中 读 取 数 据 


从 串 输入 流 中 可 以 读 出 各 种 基本 数据 类 型 的 数据 。 操 作 步 骤 大 同 小 异 , 下 面 仅 就 读 取 
整 型 数据 的 函数 展开 讨论 , 读 取 其 他 类 型 数据 的 函数 读者 可 打开 本 书 提供 的 源 代 码 中 相应 
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文件 研读 。 


1 int readInt(StrInputStream * ssin,int * x){ 

2 char s[80]; 

3 int n; 

4 while * Cssin-»current) — —''|| * (ssin->current) 一 一 At) /* 掠 过 空格 * / 
5 Cssin-»current) + t ; 

6 sscanf(ssin->current, P4 s" s) ; / * 从 当前 位 置 读 取 数 据 项 * / 
7 n=strlen(s) ; 

8 if(!n) /* 未 读 到 数据 * / 

9 return 0; 

10 ssin->current+ =n; / * 读 到 数据 ,调整 读 取 位 置 * / 
11 * x—atoi(s) ; /* 将 数据 转换 成 整数 * / 

12 return 1; 

13 } 


程序 1-6 ”从 串 输入 流 中 读 取 整 型 数据 的 C 函数 定义 


对 程序 1-6 的 说 明 如 下 。 


(1) 函数 readInt 有 两 个 参数 。 参 数 ssin 表示 一 个 指向 串 输 入 流 的 指针 ,参数 x 是 指向 


接受 数据 的 整 型 变量 的 指针 。 读 取 操 作成 功 函数 返回 1 ,否则 返回 0。 


(2) 函数 内 声明 的 局 部 变量 s 用 来 接受 从 输入 流 中 以 串 格式 读 取 的 数据 项 。n 用 来 表 


示 数 据 项 的 宽度 。 


G) 第 4 一 5 行 的 while 循环 负责 掠 过 前 导 空 格 , 保 证 数据 读 取 的 正确 性 。 第 6 行 调用 
FE PR AIC sscanf, M current 指向 的 位 置 开始 ,以 串 格式 (%s) 将 数据 项 读 取 到 ss 中。 第 7 行 计 
算数 据 项 的 宽度 n, 若 n 为 0 则 说 明 读 取 数据 项 失败 ,第 9 行 返 回 0。 读 取 成 功 时 ,n 为 正 整 
数 ,将 current 向 后 移动 n 个 字 节 作为 下 一 次 从 输入 流 中 读 取 数据 的 位 置 (可 能 含有 前 导 空 
格 )。 由 此 可 见 ,将 数据 项 先 以 串 格式 读 取 , 可 以 正确 计算 其 宽度 n, 以 此 确定 下 一 个 读 取 位 
置 current。 第 11 行 调用 库 函 数 atoi 将 存储 在 s 中 的 数据 转换 成 整 型 数 赋值 给 x 指向 的 动 


态 变 量 。 读 取 正 确 ,第 12 行 返 回 1 。 
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利用 程序 1-2 FEY. 1-4 FT. 1-5 和 程序 1-6 ,可 以 编 出 下 列 程序 来 解决 搜索 引擎 问题 。 


1 £include— stdlib. h> 
2 # include<stdio, h> 
3 £ include— string. h> 


4 £ include " . /. . /utility/strstream, h" 


5 £ include " . /. . /utility/compare. h" 
6 s include " . /. . /utility/search. h" 

7 int main(int argc.char** argv) { 

8 char first[ 80]; 

9 gets(first) ; 

10 while(strlen(first) ) { 

11 int i; 


12 StrInputStream sin; 


/* 读 出 第 1 个 搜索 任务 的 第 1 行 */ 
/* 只 要 有 任务 */ 


第 1 章 计算 问题 


13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
Al 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 


char type, second[ 250]; 


initStrInputStream( &-sin, first) ; /* 用 搜索 任务 的 第 1 行 创 建 一 个 串 流 * / 
readChar( &-sin, & type) ; /*#* 读 取 串 流 中 的 类 型 信息 * / 
switeh(type) ( 

case Y: { /* 数 据 类 型 为 整数 * / 


) 


int key,a[80],n 一 0; 
readInt( sin, & key) ; /* 读 取 关 键 值 * / 
gets(second) ; 
initStrInputStream( sin, second) ; / * HRR WHE Ol) e Hl At / 
while( !sisEof(&-sin)) 
readInt(&sin,&a[n 十 十 ]); — / * 从 流 中 读 取 整 型 数据 * / 
i=linearSearch(a,sizeof(int) ,n,&key,intGreater); 
break; 


case 'f*: ( /* 数 据 类 型 为 浮 点 数 * / 


double key,a[80]; 
int n=0; 
readDouble( & sin, & key) ; 
gets(second) ; 
initStrInputStream( &sin, second) ; 
while( ! sisEof(&-sin) ) 
readDouble( & sin, &a[ n4- 4- ) s 
i— linearSearch(a sizeof( double) , n, &-key , doubleGreater) ; 
break; 


case 'c': { /* 数 据 类 型 为 字符 * / 


char key,a[80]; 
int n—0; 
readChar( 8-sin, &-key) ; 
gets(second) ; 
initStrInputStream( &-sin, second) ; 
while( ! sisEofC 8-sin) ) 
readChar( sin, &-a[ n-- 4- D 
i= linearSearch(a,sizeof( char) ,n, &key , charGreater) ; 


break; 
) 
case 's': ( /* 数 据 类 型 为 字符 串 * / 
char * key, * a[80]; 
int n—0,j; 
key= (char * ) malloc(80 * sizeofCchar)) ; / * 为 key 分 配 空 间 * / 
for(j=0;j<80;j++) / * 为 数组 a 中 元 素 分 配 空 间 * / 
a[j]= (char * )malloc(80 * sizeof( char)) ; 
readString( &sin, key) ; /* iE BOE BA * / 


gets(second) ; 


initStrInputStream( &-sin, second) ; 
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58 while( | sisEof(&-sin) ) 

59 readString(&-sin,a[n++]); 

60 i= linearSearch(a,sizeof( char * ) ,n, key, strcmp) ; 

61 free(key) ; / * 释放 key 指引 的 空间 * / 

62 for(j=03j<805j++) / * 释放 数组 a 中 每 个 元 素 指引 的 空间 * / 
63 free(a[j]); 

64 } 

65 } 

66 ifG>—1) / * 搜索 到 * / 

67 print£ 96 d\n" i); 

68 else 

69 printfChot found! Vn ; 

70 gets(first) ; /* 读 取 下 一 个 搜索 任务 的 第 1 行 */ 
71 ) 

72 return (EXIT SUCCESS) ; 

73 } 


程序 1-7 实现 解决 搜索 引擎 问题 的 算法 1-3 的 C 源 代 码 文件 


对 程序 1-7 的 说 明 如 下 。 

CD 第 7 一 73 行 的 mian 函数 实现 算法 1-3。 其 中 ,第 10 一 71 行 的 while 循环 实现 算法 
1-3 中 第 3 一 12 行 的 while 循环 。 其 中 ,第 8 一 9 行 用 读 取 的 表示 搜索 任务 的 第 一 行文 本 
first 创建 一 个 串 输入 流 sin, 以 供 后 面 的 代码 从 中 读 取 数 据 类 型 type 和 关键 值 key。 

(2) 第 16 一 65 行 的 switch 语句 实现 算法 1-3 中 第 6 一 9 行 的 根据 不 同类 型 在 数据 集合 
中 查找 关键 值 的 操作 。 其 中 ,第 17 一 26 £1.58 27 一 37 行 .第 38 一 48 行 和 第 49 一 64 行 分 别针 
对 整 型 . 浮 点 型 .字符 型 和 字符 串 型 在 表示 数据 集合 的 数组 中 a 中 查找 关键 值 key. 

(3) 以 switch 语句 中 的 第 17 一 26 行 对 应 于 case 常量 i 的 分 语句 块 为 例 , 说 明 查 找 过 程 
的 执行 。 第 19 行 在 first 中 读 取 整 型 关键 值 key, 第 20 行 从 键盘 读 取 表 示 搜 索 任 务 的 第 二 
行文 本 second, 第 21 行 用 second 重新 初始 化 串 输入 流 sin。 第 22 行 和 第 23 行 的 while (fi 
环 读 取 其 中 的 数据 到 数组 a 中 。 第 24 行 调用 程序 1-2 中 的 函数 linearSearch 实施 在 整 型 数 
组 a 中 查找 关键 值 的 操作 返回 值 赋予 i。 

其 余 的 各 case 常量 对 应 的 分 语句 块 的 操作 细节 可 参照 上 述 分 析 理 解 。 第 66 一 69 行 根 
据 switch 语句 计算 所 得 的 i, 向 屏幕 输出 搜索 结果 信息 。 

(4) 由 于 输入 输出 文件 是 标准 控制 台 文件 (键盘 和 屏幕 ) ,所 以 算法 1-3 中 第 1 行 和 第 2 
行 的 文件 打开 操作 和 第 13 和 第 14 行 的 文件 关闭 操作 都 省 略 了 。 


1.4.3 文件 输入 输出 


在 C 语言 中 定义 了 文件 指针 类 型 FILE, 程 序 中 所 使 用 的 每 一 个 的 文件 都 必须 对 应 一 
^r FILE 类 型 的 指针 变量 。 表 1-3 列 出 了 C 语言 常用 的 文件 操作 函数 。 
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表 1-3 C 语言 常用 的 文件 操作 函数 


函 数 解 &F 
fopen( 文 件 名 串 ,打开 模式 串 ) 按 读 写 模式 打开 指定 文件 ,返回 文件 指针 
fclose( 文 件 指针 ) 关闭 文件 指针 指向 的 文件 
feof( 文 件 指针 》 检测 文件 读 写 指针 是 否 指向 文件 尾 
fgete( 文 件 指针 ) 从 指定 文件 的 当前 读 取 位 置 读 取 一 个 字符 并 将 其 返回 
fputc( 字 符 表 达 式 ,文件 指针 ) 将 字符 表达 式 的 值 写 到 指定 文件 当前 读 写 位 置 处 


fgets( 字 符 数组 , 行 长 度 , 文 件 指针 ) 


从 指定 文件 的 当前 读 写 位 置 开始 读 取 一 个 不 超过 指定 长 
度 的 文本 行 到 指定 字符 数组 中 


fputs( 文 本 行 , 文 件 指针 ) 将 指定 文本 行 写 到 指定 文件 的 当前 读 写 位 置 处 


fscanf( 文 件 指针 ,格式 串 ,变量 地 址 表 ) | 从 指定 文件 中 按 指定 格式 读 取 数据 到 指定 变量 地 址 


fprintf( 文 件 指针 ,格式 串 ,表达 式 表 ) 将 指定 表达 式 按 指定 格式 写 到 指定 文件 中 


利用 文件 操作 函数 ,把 解决 搜索 引擎 问题 的 C 程序 1-7 改写 成 文件 操作 版 本 。 


1 #include<stdlib. h> 

2 # include< stdio. h> 

3 # include<assert. h> 

4 stinclude— string. h> 

5 s include " , /. . /utility/strstream, h" 
6 # include "|. /. . /utility/compare. h" 
7 & include "|. /. . /utility/search. h" 

8 int main(int argc,char** argv) ( 

9 char first( 80]; 


10 FILE * f1— fopen('thap01/SearchEnging/inputdata. txt", 'r") , 
11 * [2— fopenC'thap01/SearchEnging/outputdata, txt", "w^ ; 


12 assert f18.8.f2) ; 
13 fgets(first,80,f1); 
14 while( ! feof(f1)){ 


/* 读 出 第 1 个 搜索 任务 的 第 1 行 */ 
/* 只 要 有 任务 */ 


15 int i; 

16 StrInputStream sin; 

17 char type, second[ 250]; 

18 initStrInputStream( &.sin, first) ; / * 用 搜索 任务 的 第 1 行 创建 一 个 串 流 * / 
19 readChar(&-sin, & type) ; /* 读 取 串 流 中 的 类 型 信息 / 
20 switch( type) { 

21 case 1: { / * 数据 类 型 为 整数 * / 

22 int key,a[80],n=0; 

23 readInt(&-sin, &-key) ; /* 读 取 关键 值 * / 

24 fgets(second, 80, f1); 

25 initStrInputStream(S-sin,second); / * 为 搜索 数据 创建 串 输入 流 * / 
26 while( ! sisEof(&sin) ) 

27 readInt(&sin,&alnt++]); — / * 从 流 中 读 取 整 型 数据 * / 

28 i=linearSearch(a,sizeof(int) ,n, &-key,intGreater) ; 

29 break; 
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30 ) 

31 case 'f'; ( /* 数 据 类 型 为 浮 点 数 * / 
32 i 

33 ) 

34 case 'c'; ( /* 数 据 类 型 为 字符 * / 
35 i 

36 ) 

37 case 's': { / * 数据 类 型 为 字符 串 * / 
38 i 

39 ) 

40 ) 

41 if(i>-1) / * 搜索 到 * / 

42 fprintfCf2, 96 d\n", i) ; 

43 else 

44 fprintf({2,"not found!\r\n") ; 

45 fgets( first, 80, £1) ; /* 读 取 下 一 个 搜索 任务 的 第 1 行 */ 
46} 


47 fclose(f1); fcloseCf2) ; 
48 return (EXIT_SUCCESS) ; 
49 } 


程序 1-8 ”解决 搜索 引擎 问题 的 C 程序 1-7 的 文件 操作 版 本 


对 程序 1-8 的 说 明 如 下 。 

CD 第 10 行 和 第 11 行 声明 了 两 个 文件 指针 型 变量 {1 和 f2, 并 分 别 被 赋予 打开 的 输入 
文件 inputdata. txt 与 输出 文件 outputdata. txt 的 指针 。 第 12 行 调用 标准 库 函 数 assert 检 
测 这 两 个 文件 是 否 成 功 打 开 。 该 函数 的 原型 为 


assert(condition) 


当 condition 的 值 为 0 时 ,系统 将 显示 condition 不 成 立 的 信息 ,并 退出 程序 的 执行 ,这 是 C 
语言 重要 的 异常 处 理 方式 。 该 函数 的 原型 声明 于 头 文件 二 assert. h> 中 。 

(2) 第 13 行 第 24 行 和 第 45 行 分 别 用 fgets 的 调用 蔡 换 程序 1-7 中 相应 位 置 上 的 gets 的 
调用 ,在 文件 生 中 读 取 文 本 行 ,而 不 是 在 键盘 上 读 取 。 第 42 行 和 第 44 行 分 别 用 fprintf 的 调 
用 蔡 换 程 序 1-7 中 相应 位 置 上 的 printf 的 调用 ,将 数据 写 到 文件 £2 中 ,而 不 是 写 到 屏幕 上 。 

(3) 第 47 行 分 别 关 闭 文件 位 和 1 人 2。 

(4) 为 节约 篇 幅 ,第 31 17.58 34 行 和 第 37 行 的 省 略 号 表示 程序 1 一 7 中 相应 位 置 的 语 
^] He ,注意 其 中 要 将 对 gets 的 调用 替换 为 fgets 的 调用 。 

程序 1-8 的 源 文件 存储 在 文件 夹 chap01/SearchEnging 中 .读者 可 打开 研读 。 


1.5 计数 问题 


数学 是 科学 的 皇后 ,而 数学 起 源 于 计数 。 人 们 的 生活 离 不 开 计数 ,相信 很 多 读者 的 童年 
都 是 在 念 着 “一 ,二 ,三 四、 五 .上 山 打 老 虎 ……” 的 童谣 中 度 过 的 。 简 单 的 计数 问题 只 需要 
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HR: 三 个 人 ,五 本 书 …… 一 眼 就 可 看 出 。 


1.5.1 简单 模拟 


问题 涉及 一 个 计数 过 程 时 ,可 以 模拟 这 个 过 程 实现 计数 。 例 如 ,下 列 由 著名 的 Joseph 
问题 演变 而 来 的 问题 就 可 以 通过 这 个 方法 加 以 解决 。 


Joseph 


The Joseph's problem is notoriously known. For those who are not familiar with the 
original problem: from among n people. numbered 1.2.-*: 5. standing in circle every mth is 
going to be executed and only the life of the last remaining person will be saved. Joseph 
was smart enough to choose the position of the last remaining person, thus saving his life 
to give us the message about the incident. For example when n —6 and m —5 then the 
people will be executed in the order 5.4.6.2.3 and 1 will be saved. 

Suppose that there are k good guys and k bad guys. In the circle the first & are good 
guys and the last k bad guys. You have to determine such minimal m that all the bad guys 
will be executed before the first good guy. 

Input 

The input consists of separate lines containing k. The last line in the input contains 0. 
You can suppose that 0 一 A 一 14. 

Output 

The output will consist of separate lines containing m corresponding to k in the input. 


Sample Input 


0 
Sample Output 


5 
30 


1. 问题 的 描述 与 分 析 


Joseph 问题 的 原始 版 本 大 意 是 : 对 给 定 的 两 个 正 整 数 n 和 ,编号 为 1~n 的 n 个 人 围 
坐 一 圈 , 从 1 号 起 连续 报 数 ,报到 m 者 出 局 。 剩 下 的 人 从 当前 位 置 开 始 从 1 起 报 数 ,报到 
者 出 局 …… 循 环 往复 ,直至 剩 下 最 后 一 个 人 。 问 出 局 者 顺序 如 何 ? 剩 下 者 的 原始 编号 是 几 ? 
例如 ,一 6, 罗 一 5 时 ,该 过 程 出 局 者 顺序 为 5,4.6.2,3, 剩 下 者 的 原始 编号 为 1。 

本 问题 是 ,给 定 正 整数 (<4) «n = 2 个 人 分 成 前 后 两 组 ,编号 分 别 为 1 一 上 和 A& 十 1 一 
n。 要 求 计算 最 小 的 m. ETHE Joseph 游戏 规则 ,最 先 出 局 的 & 个 人 恰 为 后 面 一 组 的 。 

问题 可 形式 化 地 描述 如 下 。 
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MWA: IEMA. 
输出 : 最 小 的 正 整 数 m (EAS OW 1~ n= 2k 围 坐 一 圈 的 n 个 人 ,循环 地 依次 从 1 报 
到 数 汉 ,报到 m 者 出 局 ,前 & 个 出 局 者 恰 为 原始 编号 为 k 十 1 一 n 的 那些 人 。 


2. 算法 的 伪 代 码 描述 


通过 模拟 这 个 游戏 过 程 来 对 给 定 的 上 计算 最 小 的 m。 为 便于 数学 计算 ,把 个 人 的 编 
号 设 为 0~k 一 1,k~n 一 1。 这 样 问题 转换 为 如 下 。 

输入 : ERR ko 

输出 : 最 小 的 正 整数 mn, 使 得 编号 为 0 一 n 一 1, 围 坐 一 圈 的 n= 二 2k 个 人 ,循环 地 依次 报 数 
1 到 mm, 报 到 mm 者 出 局 ,前 & 个 出 局 者 恰 为 原始 编号 为 k 一 n 一 1 的 那些 人 。 

首先 ,注意 到 m 应 为 形 如 ak 十 b 形式 的 整数 。 其 中 ,a 为 奇数 ,1 二 5k。 这 是 因为 ,第 
1 轮 报 数 到 m 者 的 编号 应 满足 k 三 :二 n。 对 所 有 可 能 的 a Ab 从 小 到 大 模拟 Joseph 游戏 
过 程 ,对 m= 二 ak 十 b, 从 第 1 轮 的 报 数 起 始 者 编号 1 0 开始 ,计算 Lm — 1 除 以 的 余数 了 ， 
它 表示 在 围 坐 一 圈 的 个 人 中 ,从 1 开始 依次 从 1 数 到 关 , 最 后 一 个 人 当时 的 编号 。 如 果 这 
个 值 小 于 则 表示 目前 的 mn 不 对 ,尝试 下 一 个 更 大 一 点 的 mm, 否则 ,n 减 小 1 表示 将 编号 大 
T k—1 的 某 个 人 出 局 ,进入 下 一 轮 报 数 。 若 通过 轮 报 数 都 使 得 出 局 的 人 编号 大 于 
& 一 1 则 得 到 正确 的 m。 将 上 述 思 想 写 成 如 下 的 伪 代 码 过 程 。 


JOSEPH(k) 

la<l 

2 while true 

3 doforb<ltok 


4 do m=<—ak+b,t<0,.n<-2k 

5 for i<-1 tok 上 > 尝试 4A 轮 报 数 

6 do t<—(t+m—1) MOD n 上 > 计算 本 轮 报 数 到 m— 1 的 人 的 位 置 
7 if 1<k then 尝试 下 一 个 2 或 Dm 不 合法 

8 n*-n—1 

9 if ;—£ then return m Dk m xt Bo k 轮 报 数 


10 a*-a--2 
算法 1-5 解决 输入 为 的 Joseph 问题 的 算法 过 程 


程序 实现 
在 C 语 言 中 实现 算法 1-5 进而 解决 Joseph 问题 的 代码 如 下 。 


1 int joseph(int k){ 

2 int m,t,a=1,b,i,n; 

3 while(1){ 

4 for(b=1;b<=ksb++){ 

5 m=a*k+b;t=0,n=2*k; 
6 for(i=1;i<=k;i++){ 


O 在 数学 中 ,计算 整数 zx RU y 的 余数 称 为 模 运 算 , 记 为 zx MOD y. 
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7 t 一 (t 十 m 一 1) Vins 

8 if(t<k) /*m 不 合法 ,尝试 下 一 个 b 或 ax/ 
9 break; 

10 mE | 

11 ) 

12 if(i>k) /* 7 m 通 过 所 有 卡 轮 报 数 */ 


13 return m; 


15 at-2; 

16 } 

17j 

18 int mainO( 

19 intk; 

20 FILE * f1—fopen('thap01/Joseph/inputdata. txt", 't) , 
21 * {2= fopenC'thap01/Joseph/outputdata, txt", Ww") ; 
22  assert([16. 8-2) ; 

23  fscanf(f1, 6d" &-k) ; 

24  whileClOt 


25 fprintfCf2, 9 dn", joseph(l)) ; 
26 fscanfCf1, 6d", &.k) ; 

27 } 

28  fÍclose(f1) ; felose({2) ; 

29 return 0; 

30 } 


程序 1-9 解决 Joseph 问题 的 C 程序 


对 程序 1-9 的 说 明 如 下 。 

(1) 第 1 一 17 行 定 义 的 函数 joseph 实现 算法 1-5 的 JOSEPH 过 程 。 代 码 结构 与 算法 过 
程 的 伪 代 码 十 分 接近 ,读者 需要 注意 的 是 C 语言 中 整数 的 模 运算 a MOD b 是 通过 运算 符 % 
来 完成 的 : a%b。 

(2) 第 18—30 行 的 main 函数 调用 函数 joseph 解决 Joseph 问题 。 第 20—22 行 打开 输 
入 输出 文件 (01,2. 

G) 第 23 一 27 行 依次 处 理 输入 文件 中 的 每 一 个 案例 。 其 中 ,第 23、26 行 从 fl 中 读 取 案 
例 数据 ,第 25 行 调用 函数 joseph 计算 最 小 的 报 数值 m 并 写 入 输出 文件 (2, 

程序 1-9 存储 为 文件 夹 chap01/Joseph 中 的 源 文件 joseph. c, 读 者 可 打开 文件 研读 ,并 
试 运行 。 


1.5.2 加 法 原理 和 乘法 原理 


然而 ,复杂 的 计数 问题 就 需要 用 心 了 。 计 数 问题 的 基本 方法 是 加 法 原理 和 乘法 原理 。 
加 法 原理 : 做 一 件 事 ,完成 它 可 以 有 类 办 法 ,在 第 一 类 办 法 中 有 m 种 不 同 的 方法 ,在 
第 二 类 办 法 中 有 m 种 不 同 的 方法 …… 在 第 类 办 法 中 有 xm 种 不 同 的 方法 ,那么 完成 这 件 
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事 共 有 N=m +m, +m, +e tm, 种 不 同方 法 。 

乘法 原理 : 做 一 件 事 , 完 成 它 需 要 分 成 个 步骤 ,做 第 一 步 有 m 种 不 同 的 方法 ,做 第 二 
步 有 m 种 不 同 的 方法 …… 做 第 nn 步 有 mm, 种 不 同 的 方法 ,那么 完成 这 件 事 共 有 六 一 za X 
mXm Xe Xm, 种 不 同 的 方法 。 

对 于 具体 的 计数 问题 ,需要 仔细 考察 完成 计数 有 哪些 方法 ,有 多 少 步骤 ,合理 运用 
加 法 原理 和 乘法 原理 得 到 问题 的 解 。 下 面 通过 一 个 问题 的 分 析 解 决 来 说 明 这 两 个 原 
理 的 运用 。 


Escape 


Description 

Hamilton.the famous thief. plans a bank robbery in L. A. When searching for the 
escape route. he takes two main factors into consideration. First. he cannot pass through 
any intersection twice since the police will set up force at any intersection after he passes it 
for the first time. Second,as,in America, vehicles are driven on the right side,it is too risk 
for Hamilton to take a left turn at intersections when escaping. So he will always drive 
straight ahead or turn right when he comes to an intersection. 

Hamilton is planning his escape route. He pays you, his partner, to calculate the 
number of different ways which leads him to his shelter. He gives you the map of the city, 
which looks like grids. with only streets leading in East- West direction and South-North 
direction, His starting position is (0,0) which is the South-West corner of the city and his 
shelter is located at Cr. y) which stands for the intersection of the (z 十 1)u South-North 
direction street and the Cy - 1)" East-West direction street. Moreover. when he starts at 
(0.0), he is heading north ,and of course. he can make a right turn there as well. 

As the total number of different ways might be very large. you are asked to give the 
number's residue modulo 100000007. 

Input 

The first line of input contains NCN 100). the number of test cases. Each of the 
following lines describes one test case. Each line consists of four integers. X.Y. x.y (0— 
X.Y<2000,0<2<X.0<y<Y).which (X.Y) is the North-East corner of the city and 
(x,y) is the location of Hamilton's shelter. The famous thief,of course.cannot driver out 
of the city. 

Output 

For each test case. print one line with a single integer which is the corresponding 
answer. 


Sample Input 


26 


第 1 章 计算 问题 


Sample Output 


1 
13 
16 


1. 问题 的 描述 与 分 析 


城市 有 编号 为 0 一 X 的 X 十 1 条 南北 方向 的 街道 ,有 编号 为 0~Y 的 了 十 1 条 东西 方向 
的 街道 ,这 些 街道 共有 (X 十 1) X(Y 十 1) 个 交叉 处 ， 
如 图 1-7 所 示 。 把 第 i(0 三 i 三 XX) 条 南北 方向 的 
街道 与 第 j(0 <j < Y) 条 东西 方向 的 街道 交叉 处 
WAG, j)。 左 下 角 交 叉 点 为 (0, 0) ,而 右上 角 交 叉 
点 为 (X,Y)。 城 市 中 的 行车 规则 : 只 能 直行 或 右 转 
B, AEE, y)(0 X x X X,0 € y € Y) HAM 
(0，0) 出 发 到 达 (z，y) 的 行车 路 线 数 。 

若 z=0, 则 只 有 1 种 行车 路 线 一 一 直行 。 对 0 
<r < OX.0 xD y SY WIE it m=min{ Y 一 y,X 
—zcr.ysx—1). ZEMO, 0) 处 出 发 , 按 行车 规则 
(只 能 直行 或 右 转 , 且 每 个 交叉 口 最 多 只 能 通过 一 


Q Y) 


yt 


次 ) 到 达 (z，y) 期 间 右 转 次 数 对 路 径 分 类 计数 。 Ner diac RE 
itm-—O0,. 


(1) 38 Y— yo m A 1 KZ: 从 (0, 0) 直 行 到 (0, y), 右 转 ,直行 到 (zx, y)。 只 有 一 条 这 
样 的 路 径 。 
(2) E X— am. 2 KB: 从 (0, 0) 直 行 到 (0，y 十 力 , 其 中 0<j < Yy. fif. 
直行 到 (zx, y 十 j)。 右 转 , 直 行 到 (zx, y)。 一 共有 Y 一 y 条 这 样 的 路 径 。 
(3) 车 y==m, 转 3 次 弯 : 从 (0, 0) 直 行 到 (0, y 十 站 ,其 中 0 二 j 三 Y 一 y。 右 转 , 直 行 到 
(z 十 i, y) Hep oci < X 一 +。 右 转 , 直 行 到 (zx, y)。 有 (Y 一 y)(X 一 z+) 条 这 样 的 路 径 。 
(D 车 x 一 1==m, 转 4 次 弯 : MO, 0) 直 行 到 (0, y Hoc; 三 了 一 y。 右 转 , 直 
行 到 (x 十 i, y D Hp oci x X 一 +。 右 转 , 直 行 到 (x 十 i, yt j—j) Hoc y, di 
HE LTTE (a. y)。 有 (Y 一 y)(X 一 xz)y 条 这 样 的 路 径 。 
F&m-l. 
(5) d; Y— y m.88 5 KE: MO, 0) 直 行 到 (0, y 十 站 ,其 中 oc;mY-— y. dift. Hf 
Sl Ge-i y D Er omi Xa. dif ESI CI y j-jo. Hioc y. dift. 
直行 到 (z 十 i 一 了， 二 7) 一 门 , 其 中 0< 二 x。 右 转 ,直行 到 (xz, y)。 有 (Y 一 y)CX 一 z)y(Cz 一 1) 
条 这 样 的 路 径 。 
(6) # X—x=m. Fe 6 KE: (Y 一 y)(X 一 +)y(zx 一 1) 条 转 了 5 个 弯 的 路 径 中 , 转 第 一 
个 弯 后 的 (Y 一 y) 条 路 径 自 上 而 下 各 有 (Y 一 y 一 1),Y 一 y 一 2,…,2,1,0 种 转 第 6 个 弯 的 可 
能 ,所 以 ,根据 加 法 原理 有 : 
((Y 一 > 一 1) 十 (Y 一 y 一 2) 十 … 十 2 十 1) (X 一 z)yCzr 一 1) 
CY —y(Y¥ —y—1)/2 (X — 2) y(x—1) 
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条 这 样 的 路 径 。 

CD 车 y= 二 m, 转 7 KE: 与 (6) 的 讨论 相仿 ,有 (Y 一 >)(Y 一 > 一 1)CX 一 z)(CX 一 xz 一 1)y 
(x 一 1)/2? 条 这 样 的 路 径 。 

(8) 若 x—1—m,f&£ 81X 25. 有 (Y 一 y)(Y 一 > 一 1)(CX 一 z)(X 一 z 一 1)y(y 一 1)(z 一 1)7/23 
条 这 样 的 路 径 。 

Fit m=2, 

(9) #Y—y=m, $k 9 KE: 有 (Y 一 y)(Y 一 y 一 1)(CX 一 z)(X 一 z 一 1)y(y 一 1)(Cz 一 1) 
(x—2)/2* 条 这 样 的 路 径 。 


一 般 地 ,对 m0. 

Py-QP2.. Py Pe 
Y—y mA hoe Bent gmat 
P? A PT. 1 
2" Des = ge 1 2m 一 1 


PPPE: z Pe 
PEL eld mda KENTE. 


条 转 4m 十 1 次 弯 的 路 径 。 


X 一 + 二 m, 有 条 转 4m 十 2 次 弯 的 路 径 。 


y=m,#i 


z—1—mjÉ OPES 1 条 转 AOn-- DACST RES. 

其 中 pA I RERERUR CI HH e PI HERI eic AS 
的 伪 代 码 。 

ESCAPE(X, Y, x, y) 

1ifz=0 


2 then return 1 

3 s-1+Y—yt(Y—y)(X—2) + (Y¥—y) (Xz) y+ Y—y) (X— 2) War 1) 
4 m--min(X—z, Y—y, x—1, y) 

5 if m=0 

6 then return s 

7 for j<-1 to m—1 


Pi- Ph- Pi Pye, Pi. P} Pi- 
8 dose E Pm 2 33 
Pj, Pi, Pi PL, , Pit) Pitt, Pit! Pi 
"E 2 2 2-9 2 2 92 21! 
9 if Y—y=m 


Př-, Pk-, Py Pf. 


10 then return s+ Dr gmat Bm-1 gmi 


ll if X-z=m 


Př-, Pł 


=: Pei. Pepe ees Pe Pes 
AES 3 LPPESPR 1 


12 then return s+ 2 "7g 2" gm} 29023 
13 if y=m 

Py-,P&-. Py Pig TYPI. Py Při 
Dl gmat gmi gmat! Dm Qa» 28-023 
gti pet! pe pr. 


2" 2” 2 zu 


14 then return s 十 
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第 1 章 
Pe Pip. PS Poo PEP Ss PT PR. 
15 return s zd geal (epu 十 2 geal geal gen 
RAPE: PS Pays T PRPIUPTa 
和 
2. 程序 实现 
利用 上 述 对 问题 的 认识 与 解决 该 问题 的 算法 ,很 容易 在 C 语言 中 编写 出 下 列 程 
1 const int MOD— 100000007; /* 这 是 一 个 素数 */ 


2 unsigned min(unsigned a. unsigned b. unsigned c. unsigned d) { 

3 unsigned x 一 a 一 一 b? a:b, y=c<=d? cid; 

4 return x —y? x:y; 

5j 

6 unsigned escape(unsigned X,unsigned Y, unsigned x, unsigned y) ( 
7 unsigned long long f1— Y — y.í2—X — x.f3—y.f4—x— 1. 


序 。 


8 P1—Íl, P2={2, P3—13, Pa=f4, — /* PI,P2,P3,P4 分 别 表 示 计 算 中 的 4 个 排列 数 * / 


9 m 一 min(Y 一 yY，X 一 x，y，x 一 1) ,j,s; 

10 证 (x 一 一 0) 

11 return 1; 

12 if(m==0){ 

13 if(Y—y==m) 

14 return 1; 

15 if(X—x==m) 

16 return 1+ (unsigned) P1; 

17 if(y— =m) 

18 return 1+ Cunsigned) P1 + (unsigned) ( P1 * P2) % MOD) ; 
19 return 1+ (unsigned) P1 + (unsigned) ( (P1 * P2) % MOD) + 


Cunsigned) ((((P1 * P2) % MOD) * P3)%MOD)， 

20 ) 
21 s=1+P1+(P1 * P2? 4 MOD-- CCCP1 * P2) 4 MOD) * P322 6 MOD; 
22 for(j=1;j<m;j++){ 
+ (((P1 * P2 4 MOD) * ((P3 * P4) % MOD)) % MOD; 
24 P1—(C— —f1 * P1/2 4 MOD;/ * 计算 关于 Y— y 的 排列 数 * / 
25 s=s+(((P1 * P2) 4 MOD) * ((P3 * P4) 4 MOD) % MOD; 
26 P2—(— —12 * P2/2D 4 MOD; / * 计算 关于 X— x 的 排列 数 */ 

—s-F (PI * P2) 64 MOD) * ((P3 * P4) 4MOD)) % MOD; 
28 P3—(— —13 * P3/2 4 MOD; / * 计算 关于 y 的 排列 数 * / 


w 
S 
a 
| 
D 


29 + (((P1 * P2) 4 MOD) * ((P3 * P4) % MOD) % MOD; 
30 ——f4 * PO 4MOD;/ * 计算 关于 x 一 1 的 排列 数 */ 
31 } 

32 if(Y—y——m) 

33 return (unsigned) s+ 


(unsigned) ((((P1 * P2) 4 MOD) * (CP3 * P4) %MOD)) % MOD); 
34 if(X—-x==m){ 
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35 s=s+(((P1 * P2) 4MOD) * (CP3 * P4)%MOD))%MOD; 
36 P1=(—— f1 * P1/2) 4 MOD; 
37 return (unsigned) s+ 
unsigned) ((((P1 * P2) 4 MOD) * ((P3 * P4) %MOD)) % MOD); 
38 ) 
39  if(y-—m)( 
40 s—s-F (CPI * P2) 6 MOD) * (CP3 * P4) 6 MOD)) % MOD; 
4l P1—(— —f1 * P1/2) 4 MOD; 
42 s—s-F (CPI * P2) 4 MOD) * (CP3 * P4) 5 MOD) % MOD; 
43 P2—(— —12 * P2/2) 4 MOD; 
44 return (unsigned) si 
(unsigned) ((((P1 « P2) % MOD) * ((P3 * P) % MOD)) 4 MOD) ; 
45 } 


46 s—s- (PI * P2)%MOD) * (CP3 * P4) 4MODD % MOD; 

47 Pl—(C——f1 * P1/2) 4 MOD; 

48 s—s-- CPI * P2) 4 MOD) * ((P3 * P4) 4 MOD) %MOD; 

49  P2—(——12 * P2/2) 4 MOD; 

50 s=s+(((P1 * P2) $MOD) * (CP3 * P4)%MOD)) % MOD; 

51 P3—(— —í3 * P3/2) 4 MOD; 

52 return unsigned) s+ (unsigned) ((((P1 * P2) % MOD) * (CP3 * P4) %MOD)) 4MOD) ; 
53) 


程序 1-10 解决 Escape 问题 的 C 程序 


对 程序 1-10 的 说 明 如 下 。 
CD 第 6 一 53 行 定义 的 函数 escape 实现 算法 过 程 ESCAPE(X, Y, z，y) 对 由 参数 表示 


的 案例 数据 X Y xy PES Ar Oe Se. Ok a ca e Die Bhg 
pta 
2*1 


,在 第 7 行 设置 这 些 式 子 中 分 子 的 当前 因子 (1,12 (3 和 {4, 分 别 初始 化 为 Y 一 y、X 一 x、 


y 和 x 一 1。 第 8 行 设置 Pl1、P2、P3 和 PA 表示 各 分 子 , 并 分 别 初始 化 为 ff2.f3 和 {4。 在 后 
面 的 计算 中 每 次 累 乘 前 将 因子 fi(i=1,2,3,4) 自 减 1 。 

(2) 第 9 行 调 用 第 2 一 5 行 定 义 的 函数 min, 计 算 Y 一 yX 一 xy Al x—1 的 最 小 值 m. 
第 10 行 和 第 11 行 处 理 算法 中 x—1 的 情形 ,第 12 一 20 行 处 理 m—0 的 情形 。 第 21 一 52 行 
处 理 一 般 的 m>O 的 情形 ,实现 算法 过 程 中 第 7—14 行 的 操作 。 其 中 ,第 22~31 行 的 for 循 
环 实现 算法 过 程 中 的 第 7 行 和 第 8 行 的 操作 。 第 32 一 33 行 、 第 34 一 38 (1.58 39 一 44 行 及 
第 45 一 52 行 分 别 对 应 算法 过 程 中 的 第 9 一 10 行 . 第 11 一 12 行 .第 13 一 14 行 及 第 15 行 的 
操作 。 

G) 由 于 两 个 非 负 整数 的 积 可 能 超出 unsigned 类 型 的 取 值 范围 , 故 P1, P2, P3, P4 及 
f1,f2.[3,f4 均 定义 为 usigned long long 的 64 位 无 符号 整 型 ,并且 在 计算 过 程 中 ,每 次 进行 
乘法 运算 后 都 对 MOD= 100000007 进行 求 模 运 算 ,使 得 在 后 面 的 乘法 计算 中 不 会 发 生 溢出 
错误 。 该 常数 定义 于 第 1 行 。 由 于 100000007 是 一 个 素数 ,所 以 所 有 小 于 该 数 的 正 整 数 对 
乘法 构成 一 个 群 , 即 对 于 乘法 运算 是 封闭 的 (参见 本 书 6. 4. 1 节 )。 
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程序 1-10 的 代码 存储 在 文件 夹 chap01/Escape 中 的 源 文件 Escape. c 中 ,可 打开 文件 研 
读 并 试 运行 。 


1.5.3 计算 四 边 形 个 数 


计数 问题 有 时 是 极 富 挑战 性 的 ,需要 仔细 考量 问题 中 所 涉及 对 象 的 数据 模型 ,研究 其 中 
的 各 个 细节 ,灵活 运用 所 有 的 数学 、 科 学 知识 和 生活 经 验 对 其 进行 充分 、 深 入 的 研究 。 例 如 ， 
下 面 这 个 问题 就 需 对 其 中 的 数据 模型 进行 由 表 及 里 地 分 析 , 找 出 输入 、 输 出 数据 之 间 的 内 在 
联系 ,进而 得 到 解决 问题 的 算法 。 解 决 复杂 问题 的 过 程 往往 是 一 个 不 断 探索 、 思 考 、 判 断 的 
过 程 ,可 以 在 这 样 的 过 程 中 获取 成 功 的 喜悦 。 


Counting Quadrangles 


Description 

Your task is to count how many quadrangles are there in this kind of picture( 见 图 1-8) 
(The following illustration is a picture whose size=7). 

Input 

There are several test cases in the input file. Each line 
contains a single number N, which is the size of the picture. 
N=0 indicates the end of input file. 

Output 


For each test case,output the number of the quadrangles in 


the format as indicated in the sample output. It’s guaranteed 
that the number is less than 29, 图 1-8 ”问题 描述 图 
Sample Input 


on 一 


Sample Output 


Case 1: 1 
Case 2: 23 
Case 3; 3108 


l. 问题 与 算法 描述 


对 输入 的 正 整 数 , 计 算 并 输出 由 x? 个 带 有 对 角 线 的 小 方块 构成 的 正方 形 图 案 中 含有 
的 凸 四 边 形 个 数 。 如 果 仅 用 眼力 解决 这 个 问题 ,估计 很 多 读者 对 图 1-9(a) 中 仅 由 4 个 小 正 
方形 构成 的 图 案 看 不 了 多 久 就 会 眼花 ,所 以 此 处 得 考虑 用 其 他 方法 解决 此 问题 。 

首先 ,我 们 观察 到 ,图 案 中 的 是 四边形 有 和 矩形 (包括 正方 形 )、 竖 直 平 行 四 边 形 ( 见 
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图 1-9(b)) ,水 平平 行 四 边 形 ( 见 图 1-9(c))、 竖 直 梯 形 ( 见 图 1-900 水平 梯 形 ( 见 图 1-9(e))、 
等 腰 梯 形 ( 如 图 1-7(f))6 种 。 它 们 在 图 案 中 大 小 相 异 ,相互 并 列 交错、 包含 。 设 最 小 正方 
形 的 边 长 为 1, 通 过 考察 图 案 中 高 度 一 定 的 各 种 四 边 图 形 的 个 数 ,利用 加 法 原理 计算 四 边 形 


(a) (b) (c) (d) (e) (0 
图 1-9 Counting Quadrangles 问题 中 的 图 案 及 其 中 所 含 的 凸 四 边 形 
写成 伪 代 码 过 程 如 下 。 


COUNTING-QUADRANGLES(n) 

1 count--0 

2 for k<l1 ton 

3 do count<count + PAR rP fé HE 2g. AY VE c 


4 return count 
算法 1-6 解决 Counting Quadrangles 问题 的 过 程 
如 果 能 在 常数 时 间 内 计算 出 图 案 中 高 度 为 k(1 三 k 志 nn) 的 四 边 形 数 量 , 则 算法 
COUNTING-QUADRANGLES 的 运行 时 间 为 O(n) 
2. 程序 实现 


要 将 算法 1-6 实现 为 程序 , 需 确切 地 计算 出 图 案 中 高 度 为 &(1 近 人 过 2) 的 四 边 形 数量 。 
为 此 ,进行 如 下 思考 。 
HUBER LI. A n FAHER H n 个 小 方块 构成 的 图 形 ,如 图 1-10 所 示 。 


VAVAVAVAVAVAVAVA 


1-10 Hin ERAS IE 


在 这 个 图 形 中 ,所 含 高 度 为 1 的 四 边 形 如 表 1-4 所 示 。 
表 14 7 个 小 方块 组 成 的 图 形 含有 高 度 为 1 的 各 种 四 边 形 个 数 计算 


图 形 * B 
矩形 DI (宽度 分 别 为 1,2，… 

竖 直 平行 四 边 形 o 

竖 直 梯形 0 
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续 表 
B x x B 
水 平平 行 四 边 形 S (宽度 分 别 为 1,2,…,n 一 DD 
水 平 梯形 2 Si (宽度 分 别 为 1,2,…,n 一 1。 斜 边 分 别 位 于 左 . 右 ) 
等 腰 梯 形 0 


根据 加 法 原理 ,该 图 形 合 有 i135 n(n t D/2--3G — Da2/2 = 2m 一 n 个 


的 是 四边形 .整个 图 案 含 及 个 这 样 的 图 形 ， 根据 乘法 
原理 ,图 案 含 有 nC2x —n) = 226 —2 个 高 度 为 1 的 凸 
四 边 形 。 


高 度 & 为 2 的 由 Zn 个 小 方块 构成 的 图 形 ,如 图 1-11 由 22 个 小 方块 构成 的 图 形 
图 1-11 所 示 。 在 这 个 图 形 中 ,所 含 的 高 度 为 2 的 四 边 
形 数量 如 表 1-5 PER. 


即 该 图 形 含有 STi tanta i420 —D 个 高 度 为 2 的 四 边 形 . 这 个 图 案 有 一 1 个 


这 样 的 图 形 , 所 以 有 (n 一 1) X Qua 32-35 i-E2(— DO 个 高 度 为 2 的 四 边 形 。 


表 1-5 2m 个 小 方块 组 成 的 图 形 含有 高 度 为 2 的 各 种 四 边 形 个 数 计 算 


"EN" " om 
矩形 icem 2n 
竖 直 平行 四 边 形 "OEREN D 
坚 直 梯 形 2n( 仅 有 宽度 为 1, 上 下 对 称 各 一 个 ) 
水 平平 行 四 边 形 S icone say Lieea-D 
水 平 梯形 Siamas 1,2， wn 一 2, 左 右 对 称 各 一 ) 
prr 20- 1) (每 条 长 笠 线 对 应 两 个 对 称 的 等 区 梯形 ) 


而 高 度 为 3 的 由 2n 个 小 方块 构成 的 图 形 ,如 图 1-12 所 示 。 此 图 形 中 所 含 各 种 高 度 为 
3 的 各 种 四 边 形 数量 如 表 1-6 所 示 。 


图 1-12 由 3n 个 小 方块 构成 的 图 形 
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表 1-6 3n 个 小 方块 组 成 的 图 形 含 有 高 度 为 3 的 各 种 四 边 形 个 数 计算 


"ENT " B 
矩形 DE Liseea) 

坚 直 平行 四 边 形 n. Q— 1) 《宽度 分 别 为 1.2) 

坚 直 梯形 BCn-- Qi— D). (宽度 分 别 为 1,2, 上 下 对 称 ) 

水 平平 行 四 边 形 Sica 1,2, .n—3) 

水 平 梯形 2S UOS 1,2,72— 3, 左右 对 称 ) 

SERE 20x 一 2 又 2( 对 称 于 每 条 3X3 正方 形 对 角 线 有 2 2 EERO 


根据 加 法 原理 ,图 形 中 含有 > i 二 3(OTO 一 1D) 二 3 i 十 20 一 2)X2 个 高 度 为 & 的 


四 边 形 . 图 案 中 共有 一 2 个 这 样 的 图 形 , 根 据 乘法 原理 ,图 案 中 共有 (n 一 2)( 5364-90 十 


n-3 
(1 — 1) +3 了)i 十 2(n 一 2) x 2) 个 高 度 为 3 的 四 边 形 。 


一 般 地 ,高 度 为 ECOL f ra RX m 个 小 方块 构成 的 图 形 中 ,所 含 高 度 为 k 的 各 种 四 
边 形 数量 如 表 1-7 所 示 。 


表 1-7 kn 个 小 方块 组 成 的 图 形 含有 高 度 为 k 的 各 种 四 边 形 个 数 计算 


图 形 x ok 
矩形 Nic ms 12,72) 

竖 直 平行 四 边 形 DELIS) 12,4 D 

[2077 2 >) EAA Ll. EFIR 

水 平平 行 四 边 形 Sica 12:558) 

水 平 梯形 15 ic ROS 1,2,…sn 一 k, 左 右 对 称 ) 

等 腰 梯 形 2(n 一 k 十 1) X G— D (对 称 于 每 条 Xk 的 斜 线 有 2X (k 一 1) 个 等 腰 梯 形 ) 


nk 


根据 加 法 原理 ,图 形 中 含有 》); 十 3 D i+3 J i+2(n—k+1)X (4 一 1) 个 高 度 为 
上 的 四 边 形 。 整 个 图 案 共 有 


à = 
-ttn Dits 2 it35it2m kt Dx an) 


i=l ioa-0-1) i=l 


Qu — k4-10(n(1 4- 1)/24- 34a — & 3- 1) (n—k)/2 
+ 3(k—1)(2n—k+2)/2+2(n—k+ 1006 — D) 
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个 高 度 为 的 四 边 形 。 其 中 ,1<k<n。 
将 上 述 的 计算 结果 用 在 算法 1-6 中 ,可 得 到 下 列 解决 Counting Quadrangles 问题 的 C 


程序 。 


1# 
2# 


include— stdio. h> 
include— assert. h> 


3 int countingQuadrangles(int n) ( 


14 
15 } 


int k,count=0; 


count=n* (2*n*n—n); /* 高 为 1* / 
for(k=2;k<=n;k++){ /* 高 为 kx*/ 
count+ =(n—k+1) * ( 
n* (n+1)/2 / * EX * / 
+3 * (n—k+1) * (n—k)/2 /* 水 平平 行 四 边 形 、 竖 直 梯形 * / 
+3 * (k 一 1) * (2 * n 一 k 十 2)/2 /* 竖 直 梯形 .平行 四 边 形 * / 
十 2* (n 一 k 十 1) * (k 一 1) /* 等 腰 梯 形 */ 


ds 
) 


return count; 


16 int main() { 


17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 } 


int n,i=1; 
FILE * f1=fopen('thap01/Counting Quadrangles/inputdata. txt",'r") , 
* {2=fopen('thap01/Counting Quadrangles/outputdata, txt", "w") ; 

assert([16.8.2) 5 

fscanfCf1, 96d", &-n) ; 

while(n) ( 
ÍprintfCf2,'Case %d: % d\n" i++ .countingQuadrangles(n)) ; 
fscanf(f1,"%d", &-n) ; 

} 

felose({1); fcloseCf2) ; 

return 0; 


程序 1-11 解决 Counting Quadrangles 问题 的 C 源 代 码 文件 Counting Quadrangles. c 


对 程序 1-11 的 说 明 如 下 。 


(1) 


第 16 一 28 行 定义 的 main 函数 中 ,第 21 一 25 行 的 while 循环 按 题目 中 规定 的 输入 


文件 的 格式 从 文件 指针 1 指引 的 文件 中 逐一 读 出 整 型 数据 n, 第 23 行 调用 实现 算法 1-6 的 函 
数 countingQuadrangles(n) 计 算 nX n 个 小 方块 构成 的 图 案 中 包含 的 凸 四 边 形 的 个 数 , 并 将 
计算 结果 作为 一 行 写 到 文件 指针 (2 指引 的 输出 文件 中 。 


(2) 


第 3 一 15 行 定义 的 函数 countingQuadrangles 实现 算法 1-6 的 COUNTING- 


QUADRANGLES。 根 据 以 上 的 分 析 , 计 算 高 度 k= 1 的 图 形 所 含 四 边 形 个 数 的 公式 与 k>1 
的 情形 不 一 致 ,所 以 第 5 行 单独 计算 块 时 的 情形 ,连同 第 6 一 13 行 的 for 循环 ,实现 算法 1-6 
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中 的 第 2 行 和 第 3 行 的 for 循环 。 将 不 同 高 度 的 四 边 形 个 数 累 加 到 变量 count 中 。 其 中 第 
8 一 11 行 分 别 计算 高 度 为 k(1 二 k 三 n) 的 图 形 中 所 含 的 和 矩形、 水 平平 行 四 边 形 和 梯形 、 竖 直 
平行 四 边 形 和 梯形 以 及 等 腰 梯 形 的 个 数 。 

源 代码 文件 CountingQuadrangles. c 存储 在 文件 夹 chap01/Counting Quadrangles 中 ， 
读者 可 打开 文件 研读 并 试 运 行 。 
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算法 就 是 输入 数据 和 输出 数据 之 间 转 换 的 计算 步骤 。 如 何 组 织 输入 数据 和 输出 数据 以 
及 从 前 者 到 后 者 转化 过 程 中 的 数据 ,将 极 大 地 影响 算法 的 效率 。 在 计算 机 科学 中 ,数据 在 计 
算 机 中 的 组 织 、 表 示 方 法 称 为 数据 结构 。 无 论 是 输入 数据 \ 输 出 数据 还 是 算法 内 部 需要 维护 
的 数据 大 多 数 情况 下 都 可 表示 为 一 些 集合 。 因 此 ,集合 既是 数学 的 基础 ,也 是 计算 机 科学 的 
基础 。 在 输入 到 输出 的 转换 过 程 中 ,算法 所 维护 的 集合 通常 需要 随时 进行 增长 .缩小 及 其 他 
变化 ,把 这 样 的 集合 称 为 是 动态 的 。 本 章 将 介绍 在 计算 机 上 表示 及 操作 有 限 动态 集合 的 一 
些 基 本 技巧 。 各 种 算法 要 求 对 集合 进行 不 同类 型 的 操作 。 算 法 对 集合 的 最 基本 的 操作 包括 
将 元 素 插入 到 集合 中 ,能 从 集合 中 删除 元 素 , 并 可 检测 元 素 是 否 从 属于 集合 等 操作 。 一 个 支 
持 这 些 操作 的 动态 集合 称 为 一 个 字典 。 

在 计算 机 中 要 表示 一 个 动态 集合 ,集合 中 的 每 一 个 元 素 都 要 表示 成 只 要 具有 指向 它 的 
指针 就 能 检测 及 处 理 其 各 属性 的 对 象 。 动 态 集合 中 的 元 素 能 分 辨 各 自身 份 的 属性 称 为 关键 
值 域 。 事实 上 集合 的 元 素 还 可 以 含有 卫星 数据 ,这 些 数 据 加 载 于 对 象 的 其 他 域 中 但 在 集合 
的 实现 中 并 不 使 用 。 为 阐述 简单 ,本 章 讨论 中 将 动态 集合 视 为 关键 值 的 集合 。 在 动态 集合 
的 实现 中 ,元 素 对 象 还 可 能 包含 一 些 集合 操作 所 要 处 理 的 域 ,这 些 域 往往 是 指向 其 他 元 素 对 
象 的 指针 (或 对 象 的 引用 ) 。 

有 些 动 态 集合 假定 关键 值 取 自 于 一 个 诸如 实数 集 或 由 字母 表 顺序 构成 的 单词 集合 这 样 
的 全 序 集 (集合 内 任意 两 个 元 素 均 有 且 仅 有 等 于 、 大 于 或 小 于 3 种 关系 之 一 )。 一 个 全 序 集 
允许 定义 集合 的 最 小 元 素 ,也 允许 集合 中 下 一 个 元 素 大 于 给 定 的 元 素 。 

动态 集合 上 的 操作 可 以 分 成 两 类 : 直接 返回 集合 的 有 关 信 息 查 询 类 操作 和 将 改变 集合 
的 变更 类 操作 。 具 体 的 应 用 通常 都 需 实现 下 列 操作 中 的 部 分 或 全 部 。 


1. SEARCH(S.k) 

这 是 一 个 查询 类 操作 ,给 定 集合 S 及 一 个 关键 值 ,返回 一 个 指向 S 中 某 元 素 的 指针 工 
使 得 tey[z]=A, 若 S 中 没有 这 样 的 元 素 返 回 NIL, 

2. INSERT(S.x) 

这 是 一 个 变更 型 操作 , 它 在 集合 S 中 添加 指向 xz 的 元 素 。 通 常 假定 元 素 zx 的 所 有 属性 
域 都 已 经 初始 化 好 了 。 

3. DELETE(S.x) 


这 是 一 个 变更 型 操作 ,给 定 一 个 指向 集合 S 中 某 个 元 素 的 指针 工 ,从 S 中 移 除 z (注意 
此 操作 使 用 的 是 指向 元 素 x 的 指针 ,而 不 是 关键 值 ) 。 
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4. MINIMUM(S) 

这 是 一 个 对 全 序 集 S 的 查询 类 操作 ,返回 指向 S 中 关键 值 最 小 的 元 素 的 指针 。 
5. MAXIMUM( S) 

这 是 一 个 对 全 序 集 S 的 查询 类 操作 ,返回 指向 S 中 关键 值 最 大 的 元 素 的 指针 。 
6. SUCCESSOR(S . x ) 


这 是 一 个 查询 类 操作 ,对 给 定 的 其 关键 值 取 自 于 一 个 全 序 集 S 的 元 素 zx, 返 回 一 个 指向 
S 中 比 x 大 的 下 一 个 元 素 的 指针 ,或 车 z 是 最 大 元 素 则 返回 NIL。 


7. PREDECESSOR(S .x) 
这 是 一 个 查询 类 操作 ,对 给 定 的 其 关键 值 取 自 于 一 个 全 序 集 S 的 元 素 ,返回 一 个 指向 


S 中 比 zx 小 的 下 一 个 元 素 的 指针 ,或 车 zx 是 最 小 元 素 则 返回 NIL, 
执行 一 个 集合 操作 的 时 间 通 常 表示 为 集合 的 大 小 的 函数 (nm)。 


2.1 线性 表 


在 对 数据 集合 的 各 种 操作 中 ,几乎 都 要 用 到 一 个 最 基本 的 操作 : 依次 考察 部 分 或 全 部 
元 素 。 这 个 操作 通常 称 为 对 集合 元 素 的 遍历 或 扫描 。 为 了 有 效 地 对 集合 元 素 进行 扫描 ,很 
自然 地 将 集合 中 的 个 元 素 一 字 排列 ,如 图 21 oo oy ae a a 


e tts 


所 示 。 i | 
在 图 2-1 的 元 素 排列 中 ,有 且 仅 有 一 个 元 素 a, RA KE 
没有 前 驱 ,该 元 素 称 为 表 头 ;有 且 仅 有 一 个 元 素 a, 没 21 一 个 线性 表 


有 后 继 , 称 为 表 尾 ;此 外 的 所 有 Lin 的 元 素 a. 均 有 一 个 前 驱 a;-1, 且 有 一 个 后 继 asas 
以 这 样 的 方式 组 织 起 来 的 数据 结构 称 为 线性 表 。 


2.1.1 线性 表 的 链表 表示 


在 计算 机 中 ,用 一 个 连续 存储 的 数组 来 表示 一 个 线性 表 是 很 自然 的 ,因为 数组 的 下 标 自 
然 地 表示 出 了 线性 表 中 元 素 的 前 后 关系 。 连 续 存 储 指 的 是 在 内 存 中 为 每 个 元 素 分 配 同等 大 
小 的 一 块 存储 空间 , 相 邻 的 存储 空间 存放 相 邻 的 两 个 元 素 。 正 由 于 数组 与 线性 表 下 标的 自 
然 对 应 关系 ,在 很 多 应 用 中 都 用 数组 来 表示 线性 表 。 

然而 ,对 线性 表 除 了 扫描 以 外 还 有 很 多 其 他 操作 ,有 些 操作 对 数组 来 说 就 未 必 是 很 方便 
了 。 例 如 ,如 果 要 对 数组 中 的 元 素 进行 增删 操作 ,每 一 次 这 样 的 操作 ,都 会 引起 前 后 元 素 的 
移动 ,这 是 很 费时 、 费 事 的 。 为 提高 这 类 操作 的 效率 ,在 计算 机 中 ,可 以 用 非 连续 存储 方式 来 
表示 线性 表 , 也 就 是 链表 方法 。 

链表 中 为 每 一 个 元 素 单独 分 配 一 个 称 为 结 点 的 存储 空间 ,元 素 间 的 前 后 顺序 是 由 指向 
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每 个 结 点 的 指针 确定 的 。 如 图 2-2 所 示 , 双 向 链表 工 的 每 一 个 结 点 具有 一 个 称 为 key 的 数 
据 域 ,两 个 分 别称 为 next 和 prev 的 指针 域 的 对 象 。 给 定 一 个 表 中 的 元 素 z,nezt[z] 指 向 其 
在 表 中 的 后 继 ,而 brev[Lz] 指 向 其 前 驱 。 若 prevLxj] 二 NIL, 元 素 x 没有 前 驱 , 因 此 是 线性 表 
的 表 首 元 素 或 称 为 表 头 (head)。 若 nexi[x]— NIL.36 2€ x 没有 后 继 , 因 此 是 线性 表 的 表 尾 
TOR MPG A RE (tail), RYE head LL 148 I] #4. tail LL ]48 18] € FÉ «f head [L ] — taill L ] — 
NIL, 则 表 是 空 的 。 

图 2-2(a) 为 用 双向 链表 工 表示 的 动态 集合 {1,4,9,16}。 表 中 的 每 一 个 元 素 是 具有 关 
键 值 域 和 分 别 指向 前 后 对 象 的 指针 域 (用 箭头 表示 )。 表 尾 的 nert 域 和 表 首 的 prev 域 都 是 
NIL, 用 正 斜 杠 表示 。 属 性 headLL Hi leg de ji ,属性 iail[L] 指 向 表 尾 。 图 2-2(b) 执 行 了 将 
key[z] 二 25 的 结 点 插入 到 工 表 首 后 ,链表 就 具有 一 个 关键 值 为 25 的 对 象 作为 表 首 head[ 工 ]。 
图 2-2(c) 接 着 是 删除 关键 值 为 4 的 结 点 后 的 链表 工 。 


pre key next 


(a) head[L] taillL] 


oraa ME- -E-E «n; 
oran — (EES =~ EISE EISE EIER — «n 


图 2-2 ”双向 链表 


在 一 个 链表 中 , 若 表 首 的 prev 域 指向 表 尾 ,而 表 尾 的 nert 域 指向 表 首 , 称 为 环形 表 。 
此 时 表 可 视 为 一 个 由 元 素 构成 的 环 。 这 样 ,链表 中 任何 一 个 结 点 都 有 唯一 前 驱 和 后 继 。 


2.1.2 对 链表 的 操作 


图 2-3 为 一 个 具有 哨兵 的 环形 双向 链表 。 哨 兵 出 现在 表 首 和 表 尾 之 间 。 属 性 head[L] 
不 再 需要 ,因为 可 以 通过 next ni (LJ KAA. I] FE. np DELHI. prev nit LL 1] 88 4X 
tail[L]。 图 2-3(a) 为 一 个 空 链表 。 图 2-3(b) 是 由 图 2-2(a) 得 来 的 链表 ,具有 键 值 9 的 表 首 
以 及 具有 键 值 1 的 表 尾 。 图 2-3(c) 为 执行 了 LIST-INSERCL,z) 后 的 链表 ,其 中 key[z] 一 
25。 新 的 对 象 称 为 表 首 。 图 2-3(d) 为 删除 键 值 为 1 的 对 象 后 的 链表 ,新 的 表 尾 是 键 值 为 4 
的 对 象 。 


1. 哨兵 结 点 


对 链表 的 操作 通常 要 处 理 链表 中 的 某 些 结 点 。 作 为 链表 的 “边界 ”, 头 结 点 无 前 驱 ， 
而 尾 结 点 无 后 继 , 对 它们 的 处 理 和 其 他 均 有 前 驱 和 后 继 的 结 点 会 有 所 不 同 。 为 简化 算法 
对 边界 条 件 的 检测 ,为 链表 工 添加 一 个 哨兵 结 点 nil LL]: 它 不 表示 任何 数据 元 素 ,但 它 是 
头 结 点 的 前 驱 , 尾 结 点 的 后 继 , 如 图 2-3 所 示 。 初 始 时 ,nezi[ni[Lj]= prev[nil[L]]= 
nil[L]。 添 加 了 哨兵 后 ,形成 了 一 个 环形 链表 ,其 中 的 每 个 结 点 都 有 各 自 的 前 驱 和 后 继 。 特 
别 地 ,nextLni[L]] 表 示 头 结 点 ,prevLnil[L] 表 示 尾 结 点 。 这 样 ,还 可 省 略 工 的 属性 head[L] 
和 zail[L]。 
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(b)  nillL] 
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-人 


图 2-3 带 有 哨兵 结 点 的 双向 链表 


Li 


H 
! 


(c) — nillL] 


(d)  nillL] 


2. 对 链表 的 扫描 


过 程 LIST-DISPLAY 从 表 头 开始 ,逐一 输出 链表 中 每 个 结 点 的 关键 值 域 key。 这 是 典型 
的 对 线性 表 的 扫描 操作 : 依次 对 表 中 的 每 个 元 素 进行 处 理 。 


LIST-DISPLAY (L) 


1 x-next[nilLL]] Dz 指向 头 结 点 

2 while z#nil[L] D x 指向 链表 中 的 正常 结 点 
3 do print key[x] 

4 x-next[ x] 


算法 2-1 输出 链表 工 的 LIST-DISPLAY HE 


其 中 参数 工 表示 一 个 链表 。 若 工 中 有 个 结 点 , 则 过 程 LIST-DISPLAY 的 运行 时 间 为 @(n)。 
对 于 双 链 表 而 言 ,扫描 可 以 是 “ 反 向 ?的 : 这 只 要 将 第 1 TBO x previ nil LL]]« Wi ES 4 
行 改 为 xr-—prev[ x] 即 可 。 


3. 在 链表 中 查找 


过 程 LIST-SERACH(L ,k) 用 简单 线性 搜索 法 在 表 工 中 寻找 第 一 个 值 为 k 的 元 素 , 返 回 
指向 该 元 素 的 结 点 指针 。 若 表 中 不 存在 值 为 的 结 点 , 则 返回 NIL。 对 图 2-3(a) 中 的 链表 ， 
调用 LIST-SERACH(L,4) 将 返回 指向 第 三 个 元 素 的 指针 ,而 调用 LIST-SERACH( 工 ,7) 将 返 
回 NIL。 

LIST-SEARCH (L,k) 

1 z-next[nilLL]] 

2 while z Anil[L] and key[xjAk 

3  doz-next[x] 

4 return x 


算法 2-2 在 双向 链表 工 中 查找 值 为 x 的 元 素 的 LIST-SEARCH 过 程 
为 在 具有 个 元 素 的 链表 中 查找 ,过 程 LIST-SERACH 在 最 坏 情形 下 耗 时 G0 ,这 是 因为 可 
能 需要 查 遍 整个 链表 。 
4. 将 元 素 插入 到 链表 中 
图 2-4 为 将 结 点 工 插 在 结 点 a 之 前 。 由 于 a 是 带 有 哨兵 的 链表 工 中 的 结 点 ,所 以 必 存 
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在 a 的 前 驱 。 图 2-4(a) 中 令 prev[La] 为 5。 图 2-4(b) 中 令 nextLr lH a, previa] Hb; BE 
next[b ]fll prevla YH x. 


(a) (b) 
图 2-4 把 元 素 插入 到 链表 中 


给 定 结 点 zx, 其 key 域 已 经 设置 好 ,LIST-INSERT 过 程 将 zx 插入 到 链表 上 L 中 结 点 a 的 前 
面 。LIST-INSERT 过 程 将 2 以 如 图 2-4(b) 所 示 那 样 “接合 ” 到 链表 结 点 a 之 前 。 

LIST-INSERT(L ,a,x) DHE LHA Aa 之 前 插入 新 的 结 点 工 

lif z—nilL] 

2 then return 

3 b+ prev[a] 

4 prev[ x ]*-5 

5 next[x]--a 

6 next[b]*—prev[a]*—x 

算法 2-3 在 双向 链表 工 的 结 点 a 之 前 插入 新 结 点 并 的 LIST-INSERT 过 程 
对 一 个 具有 个 元 素 的 链表 上 ,LIST-INSERT 的 运行 时 间 是 OC) 。 
5. 从 链表 中 删除 元 素 


过 程 LIST-DELETE 将 链表 上 中 结 点 zx 从 中 移 除 。 必 须 给 定 一 个 指向 z 的 指针 ,然后 通 
过 修改 指针 将 z 从 表 中 移 除 。 若 希望 移 除 具有 给 定 关键 值 的 元 素 ,应 首先 调用 LIST- 
SEARCH 来 检索 指向 该 元 素 的 指针 。 

图 2-5 为 将 结 点 x 从 链表 中 删除 。 由 于 z 是 带 有 哨兵 的 链表 上 中 的 结 点 ,所 以 prevLx] 
和 next[zj] 都 是 存在 的 。 图 2-5(a) 中 令 a 为 nexrt[xzj,6 为 prevL[x]。 图 2-5(b) 中 令 next] 
为 a,prev[La] 为 5。 


[ TI TT HILHEÉ 


(a) (b) 
2-5 ”从 链表 中 删除 元 素 


LisT-DELETE(L ,zx) 

1 if z=NIL DFAA 
2 then return 

3 a-—next[ x] 


4 b prev[ x] 
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5 next[b]<-a 
6 prev[a]--5 


算法 2-4 在 双向 链表 L 中 删除 结 点 z 的 LIST-DELETE 过 程 


图 2-5 展示 了 如 何 从 链表 中 删除 一 个 结 点 。LIST-DELETE 的 运行 时 间 是 OC ,但 若 希 
望 删除 一 个 具有 指定 关键 值 的 结 点 ,在 最 坏 情 形 下 需要 8(n) 时 间 , 这 是 因为 必须 先 调 用 
LIST-SERACH。 


2.1.3 链表 的 程序 实现 


下 面 用 C 语言 来 实现 通用 链表 。 
1, 类 型 定义 与 函数 原型 声明 


1 typedef struct ListNode{ /* 结 点 类 型 结构 体 * / 
2 void * key; / * 关键 值 指针 * / 
3 struct ListNode * prev; /* 前 驱 结 点 指针 */ 
4 struct ListNode * next; /* 后 继 结 点 指针 * / 
5 ) ListNode; 
6 ListNode * createListNode(void * d,int size); / x 创建 结 点 * / 
7 void clrListNode(ListNode * x,void( * proc) (void * )); / * 清理 结 点 * / 
8 typedef struct { /* 链 表 类 型 结构 体 * / 
9 unsigned long eleSize; /* 元 素数 据 存储 宽度 / 
10  int(* comp) (void * ,void * ) ; / * 元 素数 据 比 较 规则 * / 
11 ListNodex* nil; /* 头 指针 */ 
12 intn; /* 元 素 个 数 */ 
3 ) LinkedList; 
14 LinkedList * createList(unsigned long size. int( * comp) (void * ,void * )); 
/ * 创建 新 链表 * / 
15 void clrList(LinkedList * L,void( * proc) (void * )) ; / * 清理 链表 * / 
16 int listEmpty( LinkedList * 5; / * 检测 链表 是 否 为 空 / 
17 void listTravers(LinkedList * L.void( * proc) (void * )); / * 遍历 链表 * / 
18 ListNode * listSearch(LinkedList * L,void* e); /* 在 链表 中 查找 * / 
19 void listInsert(LinkedList * L,ListNode* a,void * k); /* 在 结 点 a 前 插入 结 点 k*/ 
20 void listDelete(LinkedList * L,ListNode* e); /* 在 链表 中 删除 结 点 * / 
21 void listPushFront(LinkedList * L,void* k); / * 在 表 首 插入 */ 
22 void listPushBack(LinkedList * L,void* k); /* 在 表 尾 插入 * / 


程序 2-1 链表 结 点 链表 定义 及 链表 操作 函数 的 声明 


对 程序 2-1 的 说 明 如 下 。 

(1) 我 们 的 目标 是 实现 一 个 能 容纳 任何 类 型 数据 元 素 的 通用 链表 。 在 第 1 一 5 行 所 定 
义 的 双 链 表 的 结 点 数据 类 型 ListNode 中 ,将 关键 值 域 key 定义 为 能 指向 任何 类 型 数据 的 
void * 指针 。 链 域 prev 和 next 分 别 是 指向 本 结 点 的 前 驱 结 点 后继 结 点 的 指针 。 

(2) 第 6 行 声 明了 用 来 创建 结 点 的 函数 ListNode * createListNode (void * d, int 
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size) ,该 函数 用 传递 给 它 的 存储 在 内 存 地 址 d 处 的 关键 值 初始 化 结 点 中 key 指向 的 内 存单 
元 。 参 数 size 表示 关键 值 的 存储 宽度 。 

(3) 由 于 ListNode 的 key 域 要 动态 分 配 存 储 关键 值 的 空间 , 当 某 个 结 点 从 链表 中 删除 
并 不 再 使 用 时 ,为 防止 内 存 泄漏 ,第 7 行 声 明了 一 个 清理 结 点 空间 的 函数 void clrListNode 
(ListNode * x.void( * proc) Cvoid * )), 它 负责 将 传递 给 它 的 x 所 指向 的 结 点 的 key 域 指向 
的 内 存 释放 掉 。 因 为 key 还 可 能 含有 下 一 层 动态 空间 域 , 参 数 void( * proc) (void * ) 用 来 处 
理 x 的 key 域 。 

(A) 第 8 一 13 行 定义 了 通用 链表 类 型 LinkedList。 它 包含 表示 元 素数 据 存 储 宽度 的 正 
整数 eleSize, 表 示 元 素数 据 间 的 比较 规则 的 函数 指针 comp, 指 向 哨兵 结 点 指针 nil, 表 中 元 
素 个 数 n 等 属性 。 

(5) 第 14 行 声明 的 函数 LinkedList createList (unsigned long size,int( * comp) (void 
x ,void * ) ) 用 整 型 参数 size 初始 化 链表 的 结 点 数据 域 的 存储 宽度 ,用 函数 指针 参数 comp 
初始 化 链表 的 结 点 数据 的 比较 规则 ,创建 一 个 空 的 链表 ,并 将 指向 该 链表 的 指针 作为 返回 值 
返回 。 第 15 行 声 明 的 函数 void clrList(LinkedList * L.void (x proc) (void x )) 负 责 清理 
BER L 中 的 各 结 点 空间 ,防止 内 存 泄漏 。 其 中 ,参数 void (* proc) (void * ) 用 来 处 理 结 点 
的 key 域 。 第 16 行 声明 的 函数 int listEmpty (LinkedList * DWEK L 是 否 为 空 。 

(6) 第 17 一 20 行 声 明 的 函数 void listTravers(LinkedList * L.void ( * proc) (void 
* )) listNodex listSearch(LinkedList * L.void * e.int ( * comp) (void * ,void * )) void 
insert(LinkedList * L.listNode * a.void* k,int size) fil void listDelete (LinkedList * L., 
listNode * x) 分 别 实现 了 算法 2-1 一 算法 2-4 中 的 过 程 LIST-DISPLAY , LIST-SEARCH , LIST- 
INSERT 和 LIST-DELETE. 

CD 考虑 到 插入 元 素 多 发 生 在 链表 的 两 端 ,第 21 一 22 行 声明 的 函数 listPushFront 和 
listPushBack 分 别 执行 在 表 首 插入 和 在 表 尾 插入 元 素 。 


2. 结 点 的 常规 维护 


对 程序 2-1 的 第 1 一 5 行 定 义 的 链表 结 点 类 型 ListNode 的 数据 有 两 个 常规 维护 操作 ， 
创建 结 点 和 清理 结 点 存储 空间 。 


1 ListNode * createListNode(void * d,int size) { /* 创建 结 点 * / 

2  ListNode* x=(ListNode * ) malloc(sizeof (ListNode)); — / * 为 x 分 配 空间 * / 

3 assert(x! - NULL); /* 若 x 为 空 ,中 断 */ 
4 if(d&.&-size){ /* 需 要 加 载 关键 值 * / 
5 x->key= (void * ) malloc(size) ; / * 分 配 空间 * / 

6 assert( x-»key! - NULL): / * Xi x->key 为 空 , 中 断 */ 
ri memcepy( x-»key d. size) /* 加 载 关键 值 * / 

8 x-»prev— x-»next— NULL; / * 链 域 置 空 * / 

9 } 

10 return x; 

11j 

12 void clrListNode(ListNode * x.void( * proc) (void * )) { /= 清理 结 点 * / 


13 if (x ! — NULD { 
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14 if (proc ! — NULL) /* 处 理 关键 值 * / 
15 proc(x->key); 

16 free(x->key); /* 释 放 x->key * / 
17 } 

18 x-»next— x-»prev— NULL; /* 链 域 置 空 x / 
19) 


程序 2-2 链表 结 点 的 常规 维护 函数 定义 

对 程序 2-2 的 说 明 如 下 。 

OD 第 1 一 11 行 定义 了 创建 链表 结 点 的 函数 ListNode * createListNode(void * d,int 
size). 。 它 需要 为 新 结 点 x 分 配 空 间 ( 第 2 行 和 第 3 行 ) ,为 新 结 点 x 中 的 key 域 分 配 空间 (第 
5 行 和 第 6 行 ), 然 后 调用 库 函 数 memcpy 把 第 一 个 参数 d 指引 的 宽度 为 第 二 个 参数 size 的 
内 存 中 的 数据 复制 到 x 的 key 域 中 (第 7 行 ) ,之 所 以 要 调用 memcpy 是 因为 对 void * 类 指 
针 指 引 的 内 存 不 能 直接 赋值 。 函 数 memepy 的 原型 为 


void * memcpy(void * dest,const void * src,unsigned long size) 


其 功能 是 将 以 src 指向 的 内 存 地 址 开始 size 个 字 节 内 的 数据 复制 到 以 dest 指向 的 size 个 字 
节 内 ,如 图 2-6 所 示 。 函 数 memcpy 的 原型 声明 于 头 文件 二 string. hi, iei Inl x。 


dest 
size 
i 
src 
size 
i 


图 2-6 memcpy(void * dest,const void * src, unsigned long size) 7R X 


(2) 由 于 每 个 结 点 的 key 域 指向 动态 内 存 空间 ,所 以 第 12— 19 行 定义 的 清理 结 点 空间 
函数 void clrListNode(ListNode * x.void( x proc) (void x )) 对 x 的 key 域 做 空间 释放 操作 
(第 16 行 )。 其 中 ,第 14—15 行 利用 参数 proc 对 结 点 x 的 key 域 做 释放 前 的 处 理 。 


3. 链表 常规 维护 


对 程序 2-1 的 第 8 一 13 行 定 义 的 链表 类 型 LinkedList 数据 的 常规 维护 包括 创建 链表 、 
清理 链表 存储 空间 及 判断 表 空 。 


1 LinkedList * createList(unsigned long size,int( * comp) (void * ,void x )) { /* 创 建新 链表 * / 


2 LinkedList * L— (LinkedList * ) malloc(sizeof (LinkedList)) ; / * 分 配 空间 x / 
3 assert(L! — NULL) ; /* 若 为 空 ,中 断 */ 

4 L-»nil— createListNode( NULL. 0) ; / * Y& nil 的 关键 值 置 空 * / 

5 L->nil->prev 一 L->nil->next 一 L->nil; /* 将 nil 的 链 域 指向 自身 * / 
6 L->n=0; /* 结 点 数 置 为 0* / 

7 L-»eleSize— size; /* 设 置 元 素数 据 存储 宽度 * / 
8 L-»comp-— comp; /* 设 置 元 素数 据 比较 规则 * / 
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9 return L; 


10 } 

11 void clrList(LinkedList * L,void( * proc) (void * )) { / * 清理 链表 * / 

12 ListNode * x=L->nil->next; /xx 指向 头 结 点 * / 

13 while (x!=L->nil) ( /xx 非 nilx / 

14 listDelete(L, x) ; / * 删除 xx/ 

15 clrListNode(x, proc) ; / * iiS xx / 

16 free(x) ; / * FEX x 的 空间 */ 

17 x=L->nil->next; /* x 指向 头 结 点 */ 

18 } 

19 free(L->nil) ; /* 释 放 哨 兵 结 点 指针 空间 * / 
20 L-»comp— NULL; 

21) 

22 int listEmpty(LinkedList * L) ( /* 检测 链表 是 否 为 空 * / 
23 return L-»nil-»next— =L->nil; 

24] 


程序 2-3 ”链表 常规 维护 函数 的 定义 


对 程序 2-3 的 说 明 如 下 。 

COD 第 1 一 10 行 定义 了 创建 空 表 的 函数 LinkedList * createList(unsigned long size. int 
C * comp) (void * ,void x ))。 该 函数 为 指向 新 的 链表 的 指针 L 分 配 空间 (第 2 行 和 第 3 
行 ) ,为 工 创建 哨兵 结 点 nil( 第 4 行 ), 将 L 置 空 ( 第 5 行 和 第 6 行 , 空 表 的 特征 是 哨兵 结 点 
nil 的 prev WAI next 域 均 指向 自身 上 且 元 素 个 数 n 为 0)。 用 整 型 参数 size 初始 化 元 素 存 储 
宽度 (第 7 行 ), 用 函数 指针 参数 comp 初始 化 链表 元 素 的 比较 规则 (第 8 行 )。 并 将 作为 
返回 值 ( 第 9 行 )。 

(2) 第 11 一 21 行 定义 了 清理 链表 空间 的 函数 void clrList(LinkedList * L), 它 通过 第 
13 一 18 行 的 while 循环 依次 将 当前 表 头 结 点 从 表 L 中 摘除 (第 14 行 ) ,然后 清理 该 结 点 空间 
(第 15 行 和 第 16 行 ) ,直至 表 空 。 最 后 释放 世 的 哨兵 结 点 nil 的 空间 (第 19 行 ) 。 

(3) 定义 在 第 22 一 24 行 的 函数 int listEmpty(LinkedList * L), HÆ L 中 的 头 结 点 ( 哨 
兵 结 点 nil->next) 是 否 为 哨兵 结 点 nil 来 判断 该 表 是 否 为 空 。 


4. 链表 字典 操作 


下 列 C 函数 实现 算法 2-1 一 算法 2-4 中 关于 链表 的 字典 操作 过 程 LIST-DISPLAY , LIST- 
SEARCH,LIST-INSERT 和 LIST-DELETE 等 。 利 用 LIST-INSERT 过 程 的 实现 函数 还 可 定义 
常用 的 在 表 首 插入 元 素 和 在 表 尾 插入 元 素 的 函数 。 


1 void listTravers(LinkedList * L.void( * proc) (void * )) { /* 输出 链表 * / 
2  ListNode* x—L-»^nil-»next; 

3 while (x !=L->nil) { 

4 proc(x->key) ; 

5 x—x-»next; 

6 } 

7) 
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8 ListNode * listSearch(LinkedList * L,void* e) { /* 在 链表 中 查找 */ 

9 int ( * comp) (void * ,void * ) — L-»comp; 

10 ListNode * x—L-»nil-»next; /*x 指 向 头 结 点 */ 

11 while (x !=L->nil && comp(x->key,e) !=0) / * x 3k nil 且 关键 值 非 e* / 

12 x—x-»next; /*x 后 移 一 个 结 点 * / 

13 return x; 

14 } 

15 void listInsert(LinkedList * L,ListNode * a,void* k) { /* 在 L 的 a 之 前 插入 元 素 k*/ 


16 int size— L-»eleSize; 

17 ListNode * x=createListNode(k, size) , * b—a-»prev; 
18 L->n 十 十 ; 

19 x-»next—a; 


20 x-»prev—b; 


21 a-»prev—b-»next— x; 

22 } 

23 void listDelete(LinkedList * L,ListNode * x) { / * 在 链表 中 删除 结 点 * / 
24 if (x ==L->nil) 

25 return; 


26 ListNode * a— x-»next, 
27 * b=x->prev; 

28 b->next=a; 

29 a->prev=b; 

30 L-»n——; 


31) 

32 void listPushFront(LinkedList * L,void * k)( /* 在 表 首 插入 * / 
33 listInsert(L, L->nil->next,k) ; 

34) 

35 void listPushBack(LinkedList * L.void * k){ /* 在 表 尾 插入 * / 
36 listInsert(L,L->nil,k)， 

37) 


程序 2-4 定义 链表 的 字典 操作 的 C 函数 


对 程序 2-4 的 说 明 如 下 。 

CD 第 1 一 7 行 定义 的 函数 void listTravers(LinkedList * L.void( x proc) (void * )) 实 
现 的 是 算法 2-1 的 LIST-DISPLAY 过 程 , 不 过 并 不 限于 输出 链表 的 每 个 结 点 ,而 是 通过 传递 
函数 指针 参数 proc 处 理 结 点 的 key 域 ( 第 4 行 )。 

(2) 第 8—14 行 定 义 的 函数 ListNode * listSearch(LinkedList * L,void * e) 实 现 的 是 
算法 2-2 的 LIST-SEARCH 过 程 。 和 算法 过 程 一 样 ,该 函数 有 两 个 参数 : 链表 L 和 待 查 数 
据 e。 之 所 以 参数 如 此 简洁 ,是 因为 把 元 素数 据 比 较 规则 设置 为 链表 的 属性 。 第 9 (TEL 
的 comp 属性 赋值 给 函数 指针 变量 comp, 这 是 为 了 使 代码 更 简练 。 

(3) 第 15 一 22 行 定义 的 函数 void listInsert (LinkedList * L.ListNode * a.void * k) 
实现 的 是 算法 2-3 中 的 LIST-INSERT 过 程 , 在 链表 L 的 结 点 a 之 前 插入 关键 值 为 k 的 结 点 。 
程序 代码 与 LIST-INSERT 的 伪 代 码 几 乎 一 致 ,读者 可 对 照 阅 读 理解 。 
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第 32 一 34 行 定 义 的 函数 void listPushFront(LinkedList * L,void x k) 调 用 函数 
listInsert ,将 新 结 点 插 人 到 表 头 。 

第 35 一 37 行 定 义 的 函数 void listPushBack (LinkedList * L, void * k) 也 是 利用 
listInsert 将 新 结 点 插入 到 表 尾 。 

(4) 第 23—31 行 定义 的 函数 void listDelete( LinkedList * L.ListNode * x) 实 现 的 是 
算法 2-4 中 的 LIST-DELETE 过 程 , 程 序 代码 与 LIST-DELETE 过 程 的 伪 代 码 也 十 分 相近 。 

为 便于 重用 ,把 程序 2-1 保存 为 文件 夹 datastructure rp ff 3k xc f list. h, 把 程序 2-2 一 
程序 2-4 保存 到 文件 夹 datastructure 中 的 源 文件 list. c 内 。 


2.1.4 链表 应 用 


数据 规范 问题 


问题 描述 

在 很 多 信息 处 理 的 应 用 中 ,收集 到 的 原始 数据 往往 有 一 些 重复 项 ,因此 需要 做 预 处 理 ， 
剔除 数据 集合 中 的 重复 项 并 按 一 定 的 顺序 排 好 序 。 例 如 ,原始 数据 为 整数 序列 二 5,3,7,3， 
4,8,7,9,2,8,5,1>, AE URL IE 99 —1,2,3,4,5,7,8,97, 

输入 数据 

输入 文件 inputdata. txt 包含 若干 行 ,每 一 行 表 示 一 个 案例 。 每 一 行 包含 若干 数据 项 ， 
数据 项 之 间 用 一 个 空格 隔 开 。 每 一 行 的 第 一 个 数据 项 是 一 个 字符 , 值 为 “i?、“c”、“f”、“s’ 之 
一 ,分 别 意 为 本 案例 中 数据 的 类 型 为 整 型 .字符 型 、 浮 点 型 或 字符 串 型 。 行 中 剩余 各 项 为 一 

输出 数据 

对 应 输入 文件 中 的 每 一 个 案例 ,向 输出 文件 outputdata. txt 输出 一 行 处 理 后 的 无 重复 
项 上 且 按 升序 排列 的 数据 ,数据 项 之 间 用 一 个 空格 隔 开 。 

输入 样 例 

s Wang Li Xie Wu Li Huang Wang 

i537348792851 

f34.13.75.24.13.71.53.0 

cacplcbdpmmox 


输出 样 例 


Huang Li Wang Wu Xie 

12345789 

1. 500000 3. 000000 3. 700000 4. 100000 5. 200000 
abcdlmopx 


1. 算法 描述 


解决 数据 规范 问题 需要 注意 输入 文件 的 格式 : 由 若干 行 组 成 ,每 行 表示 一 个 任务 ,其 中 
包括 的 信息 为 数据 类 型 和 同 种 类 型 的 若干 数据 。 与 搜索 引擎 问题 相仿 ,本 问题 的 关键 点 在 
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于 各 个 任务 要 处 理 的 数据 类 型 不 尽 相同 。 我 们 的 想法 是 对 每 个 搜索 任务 读 取 一 行 数据 ,从 
中 析 取 第 一 个 字符 确定 任务 中 数据 的 类 型 ,处 理 过 程 维 护 一 个 线性 表 A ,存储 任务 中 不 重复 
的 数据 ,初始 时 A 二 名 。 接 下 来 对 任务 中 的 每 一 个 数据 调用 LINEAR-SEARCH 检测 是 否 在 
A 中 出 现 , 若 否则 将 其 添加 到 A 的 合适 的 位 置 ,使 其 有 序 。 最 后 将 保存 在 A 中 的 数据 转换 
成 一 行文 本 写 到 输出 文件 中 。 算 法 伪 代 码 过 程 如 下 。 


NORMALIZE() 

1 打开 输入 文件 inputdata. txt, 其 为 万 
2 打开 输出 文件 outputdata. txt, 其 为 户 
3 while not end of f; 

4 dose) f, 中 读 取 一 行 

5 type- s 中 读 取 第 一 个 字符 

6 ses 中 去 掉 第 一 个 字符 后 的 部 分 
7 t+-PROCCESS(ty pe 5) 

8 将 串 + 作 为 一 行 写 入 文件 fe 

9 关闭 f, 

10 关闭 f; 


算法 2-5 解决 数据 规范 问题 的 算法 伪 代 码 过 程 
其 中 第 7 行 对 过 程 PROCCESS(1ype,s) 的 调用 就 是 对 含 在 s 中 的 各 项 iype 类 型 数据 进 


行 处 理 , 剔 除 其 中 的 重复 项 , 剩 下 的 元 素 按 升序 表示 为 一 个 字符 串 , 并 返回 。 伪 代码 描述 
如 下 。 


PROCCESSCtype s) 

1 创建 链表 L 

2c 

3 for s PEN rype 类 型 数据 x 

4 do if LIST-SERACH (L,x)=nil[L] 

5 then ff z HHA SIL 的 合适 位 置 使 得 L AF 
6 for 工 中 每 个 结 点 e 

7 do 将 e 中 数据 追加 到 串 上 的 尾部 


8 return ¢ 


算法 2-6 BRE A EE SERE 
2. 程序 实现 


1) 串 输出 流 
为 了 实现 算法 中 将 一 个 链表 中 的 数据 逐 项 追加 到 一 个 串 的 尾部 ,需要 实现 类 似 于 第 1 章 


中 开发 的 串 输入 流 StrInputStream 的 串 输出 流 StrOutputStream。 定 义 如 下 。 
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1 typedef struct{ 


2 char * begin; / 输出 流 首 地 址 * / 

3 char* current; /* 输出 流 当前 写 入 位置 * / 
4 int length; /* 输 出 流 长 度 * / 

5 }StrOutputStream; /< 串 输出 流 * / 


6 void initStrOutputStream(StrOutputStream * ,intb) ; /* 初始化 输出 流 */ 


第 2 章 数据 结构 基础 


7 void freeStrOutputStream(StrOutputStream * ) ; /* 清理 输出 流 空间 / 

8 int sosFull(StrOutputStream * ) ; /* 检测 输出 流 是 否 满 * / 

9 void sosFresh(StrOutputStream * ); /* 输 入 流 还 原初 始 设置 * / 

10 int writeInt(StrOutputStream * ,int); /Vx* 向 串 输出 流 写 人 整 型 数据 * / 
11 int writeDouble(StrOutputStream * , double) ; /* 向 串 输出 流 写 入 浮 点 型 数据 * / 
12 int writeChar(StrOutputStream * ,char) ; /* 向 串 输出 流 写 人 字符 型 数据 * / 
13 int writeString(StrOutputStream * „char * ); /Vx* 向 串 输出 流 写 人 字符 串 数据 / 


程序 2-5 ” 串 输出 流 类 型 的 定义 以 及 串 输出 流 操作 函数 的 声明 


对 程序 2-5 的 说 明 如 下 。 

(1) 第 1 一 5 行 定 义 的 是 串 输出 流 StrOutputStream。 它 含有 两 个 字符 型 指针 属性 : 
begin 和 current ,分 别 指向 串 流 首 和 当前 读 取 数 据 的 位 置 。 此 外 ,还 有 一 个 表示 串 输出 流 空 
间 大 小 的 整 型 属性 length. 

(2) 第 6 一 9 行 声 明了 用 来 初始 化 串 输出 流 清理 串 输出 流 空 间 、 检 测 串 输出 流 是 否 满 、 
清空 串 输出 流 中 数据 的 常规 维护 函数 initStrOutputStream freeStrOutputStream, sosFull, 
sosFresh, 

(3) 第 10 一 13 行 声明 了 用 来 向 串 输出 流 写 人 整 型 数据 、 浮 点 型 数据 .字符 型 数据 .字符 
串 数据 的 函数 writeInt、writeDouble .writeChar writeString. 

2) 串 输出 流 的 常规 维护 


1 void initStrOutputStream(StrOutputStream * sout,int size){ /* 初始 化 输出 流 * / 


2 if(sout-»begin— (char * )malloc( size * sizeof( char) )) { / * 分 配 串 输出 流 空间 * / 
3 sout->length= size; 

4 memset(sout->begin,0, size * sizeof( char) ) ; 

5 sout-»current— sout-»begin; 

6 ) 

7) 

8 void freeStrOutputStream(StrOutputStream * sout) ( /* 清理 输出 流 空 间 */ 

9 sout-»length—0; 


10 sout-»current— NULL; 
11 if(sout->begin) 


12 free(sout->begin) ; 

13 } 

14 void sosFresh(StrOutputStream * sout) { 

15 sout—>current= sout-»begin; 

16 } 

17 int sosFull(StrOutputStream * sout) { /* 检测 输出 流 空间 是 否 满 */ 
18 return sout—>current-sout—>begin> = sout->length; 

19 } 


程序 2-6” 串 输出 流 的 常规 维护 函数 


对 程序 2-6 的 说 明 如 下 。 
COD 第 1~7 行 定义 的 函数 initStrOutputStream 通过 为 串 输出 流 sout 的 begin 指针 分 
配 空间 并 将 写 入 位置 current 赋值 为 begin, 串 空间 长 度 length 赋值 为 size, 初 始 化 输出 流 
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sout, 

(2) 第 8 一 13 行 定 义 的 函数 freeStrOutputStream 负责 释放 不 再 使 用 的 串 输 出 流 sout 
的 begin 指针 的 动态 存储 空间 ,以 防 内 存 泄漏 。 

(3) 第 14 一 16 行 定义 的 函数 sosFresh 通过 将 串 输出 流 sout 的 当前 写 指 针 current W 
值 为 begin, 清 空 输出 流 中 的 数据 ,以 备 重 新 使 用 。 

(4) 第 17 一 19 行 定义 的 函数 sosFull 通过 检测 输出 流 中 的 current 指针 是 否 指向 空间 
的 末尾 来 判断 输出 流 是 否 满 。 

3) 向 串 输出 流 写 数据 

可 以 向 串 输出 流 写 人 各 种 类 型 的 数据 ,为 节省 篇 幅 , 此 处 仅 列 出 向 串 输出 流 写 入 整 
型 数据 的 C. 函数 writeInt, 向 输出 流 写 入 其 他 基本 类 型 数据 的 函数 可 打开 相应 的 源 文 
件 研读 。 


1 int writeInt(StrOutputStream * sout,int x) { /* 向 输出 流 写 人 整 型 数据 * / 
2 if(sosFull(sout) ) / * 流 空间 已 满 */ 

3 return 0; 

4 if(sout->current= = sout-»begin) /* 写 人 的 是 第 一 个 数据 / 

各 sprintf{(sout->current,"%d", x) ; 

6 else 

7 sprintf{(sout->current,"%c%d")"",x) 5 

8 sout->current+=strlen(sout->current) ; / 刷新 当前 写 和 位置 * / 

9 return 1; 


程序 2-7 向 串 输出 流 写 人 整 型 数据 的 C 函数 


对 程序 2-7 的 说 明 如 下 。 

CD 该 函数 有 两 个 参数 , 串 输出 流 指 针 sout 和 要 向 sout 写 和 的 整 型 数据 x。 写 入 成 
功 ,返回 1, 和 否则 返回 0。 

(2) 第 2 一 3 行 检测 输出 流 空间 是 否 满 。 第 4 一 7 行 的 if…else 语句 根据 写 入 的 数据 是 
否 为 第 一 个 ,决定 输出 数据 前 是 否 加 入 一 个 空格 ,这 样 写 入 输出 流 中 的 数据 以 空格 作为 分 隔 
符 。 第 8 行为 下 一 次 输出 数据 刷新 写 人 位 置 current。 以 此 方式 ,可 以 连续 地 向 一 个 串 写 入 
多 项 数据 。 

为 便于 代码 重用 ,将 程序 2-5 添加 到 utility 文件 夹 中 的 头 文件 strstream. h 中 ,将 程序 
2-6 ,程序 2-7 添加 到 同一 文件 夹 的 源 文件 strstream.c 中 。 

利用 程序 2-1 一 程序 2-7, 可 用 C 语言 实现 解决 “数据 规范 问题 ”的 程序 。 

4) 主 调 函 数 

由 于 各 个 案例 的 数据 类 型 有 所 不 同 , 所 以 尽管 处 理 流 程 近似 , 却 不 能 像 算法 那样 用 一 个 
函数 统一 处 理 而 需要 对 不 同 数据 类 型 分 别 编写 处 理 函数 。 然 后 通过 一 个 主 调 函 数 , 按 不 同 
的 数据 类 型 调用 分 类 型 处 理 函 数 各 种 类 型 的 案例 数据 。 


1 char * proccess(char type,char * s){ /* 按 type 表示 的 数据 类 型 处 理 存储 在 s 中 的 数据 * / 
2 switch(type) { 


3 case '': return intProccess(s) 


50 


第 2 章 数据 结构 基础 


4 
5 
6 
7 
8 
9 


) 


case 'c'; return charProccess(s) ; 

case ‘'; return doubleProccess(s) ; 

case 's'; return stringProccess(s) ; 
} 


freeStrOutputStream(&ssout) ; 


10 int main(int argc.char** argv) { 


返回 。 


FILE * f1— fopen('thap02/normalize/inputdata. txt", 'r") ， 
* {2=fopen('thap02/normalize/outputdata. txt", "w") ; 


char s[250]; 

assert 18. 8.12) ; 

while( !feofCf1)) { 
char type, * t; 
fgets(s,250.f1); 
type= * s; 
t=proccess(type,s +2); 
fputs(t, f2); 

) 

ÍcloseCf1) ; fclose({2) ; 

return (EXIT_SUCCESS) ; 


/ * 打开 输入 数据 文件 * / 
/ * 打开 输出 数据 文件 * / 


/* 如果 还 有 输入 数据 * / 


/* 从 中 读 取 一 行 s* / 


/* 将 处 理 好 的 数据 作为 一 行 写 人 输出 文件 * / 


/* 关 闭 数据 文件 * / 


程序 2-8 ”解决 “规范 数据 ?问题 的 C 程序 


对 程序 2-8 的 说 明 如 下 。 
(1) 第 10 一 24 行 定义 的 main 函数 实现 的 是 算法 2-5 的 NORMALIZE 过 程 。 程 序 代码 
与 算法 的 伪 代 码 非常 相近 e AS BEER o 
(2) 第 1 一 9 行 定义 的 函数 char * proccess (char type. char * s) 实 现 算法 2-6 的 
PROCCESS 过 程 , 第 2 一 7 行 的 switch 语句 根据 参数 type 表示 的 数据 类 型 调用 对 不 同类 型 的 
处 理 函 数 读 取 含 在 串 s 中 的 数据 进行 处 理 ,处 理 后 的 数据 表示 在 一 个 字符 串 中 作为 函数 值 


5) 整 型 数据 处 理 

虽然 对 各 种 类 型 的 数据 处 理 步骤 几乎 一 致 :但 C 语言 不 能 将 类 型 参数 化 ,所 以 需要 对 
每 一 种 类 型 的 数据 写 一 套 过 程 。 为 节省 篇 幅 ,此 处 仅 列 出 对 整 型 数据 的 处 理 过 程 ,对 浮 点 型 
数据 ` 字 符 型 数据 和 字符 串 数据 的 处 理 过 程 请 打开 相应 文件 比较 研读 。 


1 char * intProccess(char * s){ 


2 
3 
4 
5 
6 
T 
8 
9 


StrInputStream ssin; 


LinkedList * L— createList(sizeofC int) .intGreater) ; 


int x; 
initStrInputStream(&-ssin,s) ; 
initStrOutputStream( & ssout, 250) ; 
while( ! sisEof( &ssin) ) ( 
readInt( &ssin, &-x) ; 
if(listSearch(L, & x) ==L->nil) { 


/* 整 型 数据 处 理 函 数 / 
/* 创建 串 输入 流 */ 
/* 创建 整 型 链表 Lx*/ 


/* 用 ss 初始化 串 输入 流 */ 

/* 初 始 化 串 输出 流 * / 

/* 处 理 输入 流 中 的 数据 * / 

/* 从 输入 流 中 读 取 一 项 数据 x* / 
/* 若 x 没有 出 现在 表 工 中 */ 
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10 ListNode * a=L->nil->next; /*a 从 头 结 点 开始 * / 
M while(a! =L->nil& & * (Cint * )(a->key)) 一 x) /* 找到 插入 位 置 */ 
12 a—a-»next; 

13 listInsert(L.a,&x) 5 /* 在 a 之 前 插入 */ 
14 } 

15} 

16 listTraverse(L, putInt) ; /* 将 链表 中 数据 逐 项 写 到 串 输入 流 中 * / 
17 clrListCL, NULL) ; 

18 writeString( S-ssout, An" ; /* 构成 一 行 * / 

19 return ssout. begin; 

20) 


程序 2-9 处 理 整 型 数据 的 C 函数 


对 程序 2-9 的 说 明 如 下 。 

(1) 第 3 行 创 建 一 个 链表 L, 第 5 行 用 传递 给 它 的 参数 s 创建 一 个 串 输入 流 ssin， 
第 6 行 初始 化 串 输出 流 ssout 缓冲 区 长 度 为 250B。 第 7 一 15 行 的 while 循环 逐一 读 取 ssin 
中 的 数据 项 到 x 中 (第 8 行 ) ,调用 listSearch 函数 检测 x 是 否 在 L 中 存在 (第 9 £30 3 x 
出 现在 直 中 ,第 11 一 12 行 通过 一 个 while 循环 确定 关键 值 为 x 的 结 点 的 插入 位 置 (由 a JR 
引 )。 第 13 行 调用 函数 listInsert, 将 x 插入 到 LL 中 a 之 前 。 这样 ,L 中 存储 了 ssin 中 所 有 各 
不 相同 的 数据 项 且 有 序 。 第 16 行 调用 listTraverse 函数 ,用 传递 给 它 的 putInt 将 L 中 的 元 
素 逐 一 写 到 ssout 中 。 第 17 行 调用 clrList 函数 清理 链表 L 的 存储 空间 ,防止 内 存 泄漏 。 第 
19 行将 写 到 ssout 中 的 数据 构成 的 串 作 为 返回 值 返回 。 

(2) 由 于 listTraverse 函数 的 第 二 个 参数 是 void( * proc) (void * ) 的 函数 指针 , 仅 含 一 
个 指针 参数 ,为 能 正确 地 将 每 个 结 点 的 数据 写 到 串 输出 流 中 ,需要 定义 一 个 全 局 性 的 串 输出 
流 ssout, 并 定义 类 型 为 void( * proc) (void * ) 的 函数 将 指定 类 型 数据 写 入 ssout。 这 些 工 
作 , 都 添加 到 第 1 章 创 建 的 strstream. h 和 strstream. c 中 。 


StrOutputStream ssout; / * 全 局 串 输出 流 * / 
void putIntCint * ); 

void putChar(char * ) ; 

void putDouble( double * ) ; 

void putString(char * ); 


程序 2-10 加 入 到 头 文件 strstream. h 中 的 全 局 串 输出 流 sout 的 定义 及 
用 于 向 sout 写 人 基本 数据 类 型 数据 的 函数 声明 


void putInt(int * data) { 
writelnt(&.ssout, * data); 

} 

void putChar(char * data) { 
writeChar(&-ssout, * data) ; 


) 
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void putDouble(double * data) ( 
writeDouble(&-ssout, * data); 

) 

void putString(char * data) { 
writeString( &ssout, data) ; 


} 


程序 2-11 加 入 到 源 文 件 strstream. c 中 的 用 于 向 全 局 串 输出 流 sout 
写 人 基本 数据 类 型 数据 的 函数 定义 


程序 2-8 和 程序 2-9 保存 在 文件 夹 chap02\normalize 的 源 文件 normalize.c 中 。 


2.2 dX 


栈 和 队列 是 用 线性 表 表 示 的 动态 集合 ,用 DELETE 操作 从 这 些 集合 中 删除 的 元 素 是 预 
先 指定 的 。 在 栈 中 ,从 集合 中 删除 的 元 素 是 最 近 才 插入 其 中 的 , 栈 实 现 的 是 后 进 先 出 
(LIFO) 的 策略 。 类 似 地 ,在 队列 中 ,删除 的 元 素 总 是 集合 中 留 驻 时 间 最 长 的 ,队列 实现 的 是 
先进 先 出 (FIFO) 的 策略 。 有 若干 种 在 计算 机 上 实现 栈 和 队列 的 有 效 方法 。 本 节 中 ,将 说 明 
如 何 利用 一 个 链表 来 实现 它们 。 


2.2.1 栈 的 概念 及 其 链表 实现 


对 栈 进行 的 INSERT 操作 PUSH 常 称 为 压 栈 , 而 对 不 带 任何 参数 的 DELETE 操作 POP. 
常 称 为 弹出 。 这 些 名 称 取 自 实际 上 的 栈 , 如 餐馆 里 使 用 的 带 有 弹簧 的 盘 碟 栈 。 盘 子 从 中 弹 
出 的 顺序 与 盘 释 压 入 栈 的 顺序 是 相反 的 ,所 以 只 有 栈 顶 的 盘子 才 是 可 取 的 。 

如 图 2-7 所 示 ,可 以 用 一 个 链表 来 实现 一 个 栈 S。S 有 两 个 属性 ,一 个 是 链表 LS] A 
一 个 属性 是 栈 顶 ropLS], 它 指向 最 近 才 插入 的 元 素 ( 表 头 head) 。 该 栈 由 元 素 head[LLLS]] 
(三 top[S])…tail[LLSJ]J 组 成 ,其 中 head[LLLS]]=top[LS] 是 栈 顶 ,而 iaiLLLS]] 是 栈 底 。 

当 top[ S] NIL 时 , 栈 就 不 含有 元 素 而 成 为 空 的 了 。 可 以 用 询问 操作 STACK-EMPTY 
来 检测 栈 是 否 为 空 。 若 一 个 空 的 栈 执行 弹出 操作 , 称 其 为 下 溢 , 这 通常 是 一 个 错误 。 利 用 链 
表 实 现 的 栈 , 没 有 上 滋 , 即 栈 空间 满 时 被 执行 压 栈 操作 的 情形 ,这 是 因为 链表 空间 是 通过 结 
点 的 增删 动态 管理 的 。 

利用 链表 的 操作 , 栈 的 各 种 操作 都 可 简单 地 加 以 实现 。 仍 然 使 用 带 有 哨兵 的 链表 作为 
栈 S 的 属性 工 。 


STACK-EMPTY(S) 

1 if top[S]=nil[LCS]] 
2 then return TRUE 
3 else return FALSE 
PUSH(CS,z) 
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1 创建 一 个 以 z 为 关键 值 的 结 点 zi 

2 LIST-INSERT(L[S] ,next[ nil LLES]]] i 
3 topL S]-—2i 

POP(S) 

1 if STACK-EMPTY(S) 

2 then error 'underflow" 

3 else z-—top[ S] 

4 top| S]-7next[ x] 

5 LisT-DELETECL[S]. 2) 

6 return x 


算法 2-7 基于 链表 的 栈 操作 算法 
图 2-7 说 明了 变动 性 操作 的 效果 。 每 个 操作 的 耗 时 都 是 OC) 
图 2-7(a) 中 , 栈 S 有 4 个 元 素 , 栈 顶 元 素 是 9。 图 2-7(b) 为 调用 PUSH(S,17) 和 PUSH(S,3) 
后 的 栈 。 图 2-7(c) 为 调用 POP(S) 后 的 栈 ,POP(S) 返 回 元素 3, 该 元 素 是 最 近 才 压 人 栈 的 。 
栈 顶 现在 是 元 素 17。 


tee EL HERR - o ma) 


top 


= 
3 
© 
nN 
o 
t 
a 
= 


top 
(c) 


2-7 栈 S 的 链表 实现 


2.2.2 栈 的 程序 实现 


在 C 语言 中 ,程序 员 需 要 亲自 实现 栈 数据 结构 。 利 用 2. 2. 1 节 所 实现 的 带 有 哨兵 结 点 
的 链表 结构 LinkedList 作为 栈 中 元 素 的 存储 载体 .将 栈 定义 为 下 列 结构 。 


1 typedef struct{ / * 栈 类 型 * / 

2 LinkedList * L; /* 链 表 属 性 * / 

3 ListNode * top; /=* 栈 顶 属性 * / 

4 JStack; 

5 Stack * createStack( unsigned long size) ; / * 创建 空 栈 * / 

6 void clrStack(Stack * S.void( * proc) (void * )); /* 清理 栈 空间 */ 
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7 int stackEmpty(Stack * S); / * 检测 栈 空 * / 
8 void push(Stack * S,void * k); / * 压 栈 操作 x*/ 
9 ListNode * pop(Stack * S); /* 弹 出 操作 * / 


程序 2-12 ”基于 链表 的 栈 类 型 定义 及 栈 操作 函数 的 声明 


对 程序 2-12 的 说 明 如 下 。 

CD 第 1 一 4 行 定义 栈 类 型 Stack. Stack 有 两 个 属性 ,一 个 是 作为 元 素 载体 的 链表 L, 
另 一 个 是 指向 栈 顶 元 素 的 指针 top。 其 中 ,链表 结 点 类 型 ListNode 和 链表 的 类 型 
LinkedList 及 其 操作 函数 已 在 2. 2. 1 节 加 以 定义 。 代 码 在 文件 夹 data structure 中 的 头 文 
件 list. h 和 源 文件 list. c 中 ,读者 可 打开 研读 。 

(2) 第 5 一 6 行 声明 了 两 个 关于 栈 的 常规 维护 函数 ,包括 第 5 行 的 createStack 函数 创建 
一 个 新 的 栈 ; 第 6 行 的 clrStack 函数 在 栈 使 用 完毕 清理 空间 。 

G) 第 7 一 9 行 声明 了 实现 算法 2-7 中 各 过 程 的 函数 。 第 7 行 的 stackEmpty 函数 实现 
算法 过 程 STACK-EMPTY 检测 栈 是 否 为 空 ;第 8 行 的 push 函数 实现 压 栈 算法 过 程 PUSH; 
第 9 行 的 pop 函数 实现 弹 栈 算法 过 程 POP. 

为 便于 代码 重用 ,将 程序 2-12 存储 为 data structure 文件 夹 内 的 头 文件 stack. h。 并 在 
下 列 的 stack. cpp 源 文件 中 定义 上 述 的 栈 操作 函数 。 

1 #include<assert. h> 

2 # include 'stack. h" 


3 Stack * createStack( unsigned long size) ( /* 创建 空 栈 * / 

4 Stack * S= (Stack * ) malloc(sizeof(Stack)) ; / * 分 配 空 间 * / 

5 assert(S! — NULL) ; / * 保证 空间 分 配 成 功 * / 
6 S-»L- createList( size» NULL) + /* 创建 链表 属性 * / 
7 S->top=S->L->nil; /#* 初 始 化 栈 顶 * / 

8 return S; 

9) 

10 void clrStack(Stack * S.void( * proc) (void * )){ 

11 S->top=NULL; / * 栈 顶 指针 置 空 * / 
12 clrList(S->L, proc) ; /* 清理 链表 空间 * / 
13 free(S->L) ; 

14) 

15 int stackEmpty(Stack * S)( /* 检测 栈 空 x / 

16 return S->top= =S->L->nil; 

17} 

18 void push(Stack * S,void * k){ /* 压 栈 操作 */ 

19 listPushFront(S->L,k) ; /* 在 链表 尾 插 入 * / 
20 S->top=S->L->nil->next; /* 设 置 新 的 栈 顶 */ 
21} 

22 ListNode * pop(Stack * S){ /< 弹出 操作 * / 

23 assert(!stackEmpty(S)); /* 检测 下 溢 * / 

24 ListNode * x=S->top; /x*x 设 置 为 栈 顶 */ 
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25 S-»top— x-»next; [| * WEBBER S / 

26 — listDelete(S->L,x); /=* 将 栈 顶 从 链表 尾部 摘除 * / 
27 return x; 

28 } 


程序 2-13 ”定义 栈 操作 的 C 函数 


对 程序 2-13 的 说 明 如 下 。 

COD 第 3 一 9 行 定 义 的 函数 createStack 创建 一 个 新 的 空 栈 。 第 4 行为 栈 分 配 空间 ,第 6 
行 调用 createList 函数 传递 参数 size 和 NULL 设置 链表 属性 L。 注 意 , 程 序 2-3 中 定义 的 
函数 createList 的 两 个 参数 的 意义 : 前 者 size 表示 结 点 的 数据 存储 宽度 ,后 者 comp 表示 结 
点 数据 大 小 比较 的 规则 。 由 于 栈 中 元 素 无 须 比 较 大 小 ,所 以 第 2 个 参数 传递 NULL。 最 后 
第 7 行将 栈 顶 指针 置 空 ( 注 意 所 使 用 的 是 带 有 哨兵 结 点 的 链表 ) 。 

(2) 第 10 一 14 行 定义 的 函数 clrStack 清理 proc 作为 第 1 个 参数 传递 给 它 的 栈 S 的 存 
储 空间 。 由 于 栈 的 链表 属性 拥有 动态 空间 ,所 以 利用 传递 给 它 的 链表 结 点 空间 处 理 函 数 
指针 参数 proc, 第 12 行 调用 clrList 函数 清理 L 的 存储 空间 ,第 13 THA PR L 的 空间 。 

(3) 第 15~17 行 .第 18 一 21 行 以 及 第 22 一 28 行 定 义 的 stackEmpty push 和 pop 函数 
实现 算法 2-7 中 的 栈 操 作 过 程 STACK-EMPTY、STACK-PUSH 和 STACK-POP。 实 现代 码 与 
算法 伪 代 码 十 分 接近 ,读者 可 自行 比较 。 

为 便于 代码 重用 , 特 将 程序 2-13 的 代码 存储 为 文件 夹 datastructure 中 的 源 文件 


stack. c, 


2.2.3 栈 的 应 用 


现在 用 以 上 开发 的 栈 结构 解决 下 列 应 用 问题 。 
Eventually periodic sequence 


Given a function f: 0.. N — 0.. N for a non-negative N and a non-negative integer n 
<N. One can construct an infinite sequence F= f! (n) , f? (n) «f^ (n) where f* Cn) 
is defined recursively as follows: f'(n)=f(n) and f**! G) = fCf* G0). 

It is easy to see that each such sequence F is eventually periodic.that is periodic from 
some point onwards.e. g. 1.2.7.5.4.6.5.4.6.5.4.6**. Given non-negative integer N 
11000000 ,nN and f.you are to compute the period of sequence F. 

Each line of input contains N. x and the description of f in postfix notation, also 
known as Reverse Polish Notation (RPN). The operands are either unsigned integer 
constants or N or the variable x. Only binary operands are allowed: + (addition), 
* (multiplication) and % (modulo, i. e. remainder of integer division). Operands and 
operators are separated by white space. The operand % occurs exactly once in a function 
and it is the last (rightmost.or topmost if you wish) operator and its second operand is 
always N whose value is read from input. The following function: 

2x*7+N% 
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is the RPN rendition of the more familiar infix (2 * z-- 7) 6 N. All input lines are shorter 
than 100 characters. The last line of input has N equal 0 and should not be processed. 

For each line of input. output one line with one integer number, the period of F 
corresponding to the data given in the input line. 

Sample input 

101zN % 

1l111zz1l+* N% 

17281z r1 * r2 * N% 

1728 1 zz 1 十 z2 十 * * N% 

100003 1 zz 123+ * x 12345+* N% 

000N X 


Output for sample input 


l. 问题 描述 与 分 析 


给 定 函 数 /(z): {0..N} 一 {0..N)}。 对 任 一 0<n<N, 可 得 到 序列 : 
F= ( fin) sf? (n) oes ft Cn) oe} 

HP, DSS a), WRF 是 一 个 周期 循环 序列 。 

输入 文件 由 若干 行 组 成 ,每 一 行 的 前 两 项 为 N 入, 余下 部 分 是 一 个 由 道 波兰 表达 式 
(Reverse Polish Notation, RPN) 给 出 的 函数 /(z) 的 定义 式 。 其 中 的 运算 对 象 包括 作为 运 
算数 的 带 符号 常量 .N 和 变量 z 以 及 运算 符 十 、* 、%。 我 们 的 任务 是 对 每 一 行 指定 的 x 和 
N 值 以 及 函数 /(z) 的 表达 式 , 计 算 序 列 下 ,输出 该 序列 的 最 小 重复 周期 。 

解决 这 个 问题 有 两 个 关键 点 : 首先 ,如 何 根据 表示 为 串 的 逆 波 兰 式 计算 函数 值 。 其 次 ， 
如 何 找 到 序列 fz) ,f(z),…,/*(z),… 中 的 最 小 周期 。 对 于 前 者 ,可 以 在 分 析 道 波兰 式 
时 ,利用 一 个 栈 S 计算 出 表达 式 的 值 。 例 如 ,对 输入 样 例 中 的 串 “zz 1 十 * N%”, 图 2-8 展 
示 了 计算 的 过 程 。 

图 2-8(a) 分 析 到 式 中 第 1 个 运算 数 zx, 将 其 压 和 人 栈 S。 图 2-8(b) 分 析 到 第 2 个 运算 数 
x EAR S. Fl 2-8(c) 分 析 到 第 3 个 运算 数 1, 将 甚 压 人 栈 S。 图 2-8(d) 分 析 到 运算 符 十 ， 
弹出 S 中 的 两 个 运算 数 1 和 >z, 相 加 后 压 入 栈 S。 图 2-8(e) 分 析 到 运算 符 * ,弹出 S 中 的 两 
个 运算 数 zx 十 1 Ale HARA S. 图 2-8(f) 分 析 到 运算 数 N, 将 其 压 栈 。 图 2-8(g) 分 析 到 
运算 符 % ,弹出 S 中 的 两 个 运算 数 N 和 zx (z 十 1) ,计算 后 将 所 得 结果 zx (zx 十 1) %N JERE. 

对 计算 得 到 的 结果 ,存储 在 x 中 ,作为 计算 序列 f(z) of? Co) vee fC) oe BA BA 
元 素 的 函数 自 变量 用 。 序 列 FG ef? GO un f GO s A PA /[1.. NJ 存储 ,每 
计算 出 一 个 4*(z) ,就 保存 在 f[&j] 中 。 并 且 判 断 f[kj 是 否 与 f[1]~~f[k 一 1] 中 的 某 一 个 
可 相等 。 若 是 , 则 & 一 i 就 是 该 序列 的 最 小 周期 。 否 则 .计算 下 一 个 f*11(x)。 
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xx 1+H#N 96 xx 1+4#N% xx 1+*N% xx 1+*N% 
| t t t 
1 

x x x+l 
s x S x S x S x 
(a) (b) (c) (d) 

xx 1+4N% xx HEN 96 xx 144N% 

4 
t t 
N 
s [0D s [64D S [ DAN 
(e) (f) (g) 


图 2-8 利用 栈 计算 逆 波 兰 式 


把 根据 逆 波兰 式 RPN、 自 变量 值 x 与 模 N 计算 出 /(z) 的 过 程 表 示 为 下 列 的 伪 代 码 。 


CALCULATECRPN,z,N) 

1 s-Ø 设置 空 栈 
2 while RPNz C) 

3 do d--read a item from RPN 


4 if dE (rS 6) DE d 是 运算 符 

5 then op; *- POPCS) DAR S 中 弹出 第 2 个 运算 数 
6 op -POPCS) DAR S 中 弹出 第 1 个 运算 数 
7 ifd='+' 上 > 若 运算 符 为 十 

8 then PUSH(S,0p; 十 op ) 上 > 计算 两 数 之 和 并 压 人 栈 中 

9 else if d 一 '# 上 > 若 运算 符 为 * 

10 then PUSHCS«0pi * opz) 上 > 将 两 数 之 积压 栈 

11 else PUSHCS ,op %opz) bis WERE Y 

12 else PUSH(S,d) Dd 是 运算 数 


13 return Pop(S) 


算法 2-8 解决 Eventually periodic sequence [0] Bi P it Fw UE 25 z& RHY WAKE CALCULATE 
利用 CALCULATE ict f£ ,把 解决 Eventually periodic sequence 问题 的 算法 写成 如 下 伪 


代码 。 
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EVENTUALLY-PERIODIC-SEQUENCE() 
1 打开 输入 文件 inputdata. txt, EW fi 
2 打开 输出 文件 outputdata. txt, 其 为 fe 
3 while true 
4 do s<-read a line from fi 
N< read the first item of s 
x--read the seconed item from s 
if z=0 and N—0 

then return 
i—0,RPN<s 中 剩余 部 分 
10 f[ij<z<-CALCULATE(RPN , x. N) 
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11 while f[i] ¢ ( fL0].--  f/Li—1]) 

12 do iil 

13 fLi]--x-CALCULATECGRPN , x, N) 

14 write i—& into f; as a line» where k€ (1. .;—1) that f[&]— fli] 


算法 2-9 fU Eventually periodic sequence 问题 的 算法 过 程 EVENTUALLY-PERIODIC-SEQUENCE 
2. 程序 实现 


利用 程序 2-12 和 程序 2-13 ,可 把 解决 Eventually periodic sequence 问题 的 算法 2-8 编 
写 为 以 下 程序 。 


1 unsigned calculate(StrInputStream * rpnyunsigned long long x,unsigned long long N) { 


2 Stack * S=createStack(sizeof(unsigned long long) ) ; / fil ESS BE / 

3 char d[20]; / * 运算 对 象 子 串 * / 

4 unsigned long long op] ,op2,r; /*#* 运 算数 和 运算 结果 * / 
5 while( !sisEof(rpn)) ( /*rpn 非 空 */ 

6 readString(rpn,d); /* 分 析 当 前 运算 对 象 */ 
7 if(stremp(d,"+") — —0 || stremp(d,"* '5 — —0 || stremp(d,"%") — =0){ /* 运算 符 */ 
8 0p2— * ( (unsigned long long * ) (pop( S) -5key)) + /* 弹出 运算 数 * / 

9 op1 一 * (unsigned long long * )( pop( S) -5key? /* 弹出 运算 数 */ 

10 if( * d 一 一 十 7 /* "bn / 

11 r=opl+op2; / * AER / 

12 else if( * d- —'«» /* 是 "*"*/ 

13 r—opl * op2; /* 计 算 积 */ 

14 else 

15 r=opl % op2; /* 是 %"， 求 余数 */ 

16 push(S, &r); /* 运算 结果 压 栈 */ 

17 Jelse{ /* 是 运算 数 * / 

18 if(stremp(d,"k") = =0) 

19 push(S, 8.3); 

20 else if( stremp(d. N' = =0) 

21 push(S, &ND + 

22 else( 

23 r—atoi( d) ; /* 转换 为 整数 * / 

24 push(S, &-r) ; /* 运 算数 压 栈 * / 

25 

26 ) 

27} 

28 r= * (unsigned long long * ) (pop(S)->key) ; / * 栈 中 唯一 元 素 为 函数 值 * / 
29 clrStack( S, NULL); /* 清理 栈 空 间 */ 

30 free(S); 

31 return r; /* 返 回 函 数值 * / 

32) 


程序 2-14 ”实现 算法 2-8 的 C 函数 


59 


从 算法 到 程序 (第 2 NO 


对 程序 2-14 的 说 明 如 下 。 

A) 函数 calculate 实现 算法 2-8 中 的 CALCULATE 过 程 。 与 算法 过 程 一 样 有 3 FSM: 
表示 f(x) 的 道 波兰 表达 式 rpn, 初 始 时 值 为 输入 n 的 自 变量 x, 以 及 作为 模 运 算 的 模 N。 
rpn 是 作为 一 个 串 表 示 表 达 式 的 ,其 中 又 含有 若干 个 需要 读 取 的 数据 项 ,上 且 类 型 各 不 相同 ， 
所 以 把 参数 rpn 定义 成 第 1 章 中 程序 1-4 和 程序 1-5 开发 的 串 输入 流 类 型 StrInputStream 。 
虽然 从 题 面 上 知 x 和 N 的 类 型 应 为 unsigned ,但 是 在 计算 /(zx) 的 过 程 中 x 和 N 都 需要 压 
入 一 个 工作 栈 中 ,而 压 和 人 栈 中 的 数据 还 包括 rpn 中 的 各 运算 数 参加 运算 的 中 间 结 果 , 这 些 数 
据 可 能 超出 unsigned 的 取 值 范围 ,所 以 栈 中 元 素 的 存储 宽度 应 为 unsigned long long 宽度 。 
又 由 于 通用 栈 压 栈 操作 中 是 用 内 存 复 制 的 方法 替代 赋值 ,所 以 需要 把 作为 参数 的 x 和 N 也 
定义 成 unsigned long long 类 型 。 函 数 返回 自 变量 为 x 时 f(z) 的 值 ,由 于 表达 式 的 最 终 值 是 
模 为 NCN 志 11000000) 模 运算 结果 ,所 以 返回 值 类 型 设 为 unsigned. 

(2) 与 算法 过 程 一 样 ,函数 内 部 需要 设置 用 来 从 rpn 中 读 取 数 据 项 的 变量 d, 在 计算 过 
程 中 使 用 的 栈 S 和 表示 操作 数 的 变量 opl 和 op2。 由 于 开发 的 通用 栈 只 能 将 指定 地 址 内 数 
据 压 栈 ,所 以 需要 设置 一 个 变量 r 用 来 存储 计算 过 程 中 的 结果 。 由 于 逆 波 兰 表 达 式 中 既 包 
含 运算 数 又 包含 运算 符 , 所 以 每 次 先 从 中 读 取 的 数据 项 d 的 类 型 定义 为 一 个 能 表示 字符 串 
字符 数组 。 对 于 运算 数 ,由 于 两 个 非 负 整 型 数 (32b) 的 和 或 积 可 能 发 生 上 溢 , 所 以 运算 数 
opl.op2 和 运算 结果 定义 成 非 负 的 long long 型 (64b) 。 

G) 第 2 行 调用 函数 createStack 创建 一 个 在 程序 2-12 定义 的 栈 结构 对 象 $S, 压 人 栈 的 
数据 根据 前 面 的 讨论 可 知 应 为 unsigned long long 类 型 。 然 后 根据 d 所 含 的 内 容 来 判定 读 
到 的 运算 对 象 是 运算 数 还 是 运算 符 。 

第 5 一 27 行 的 while 循环 实现 算法 过 程 CALCULATE 中 的 第 2 一 12 行 的 while 循环 。 其 
中 ,第 7 行 用 表达 式 stremp(d."+")==0 || stremp(d."* * — —0 || stremp(d."%") — —0 表示 4d 
€ ("Ens A). BUT TAS 8 一 17 行 对 应 于 算法 过 程 中 的 第 5 一 11 行 的 处 理 运 算 符 的 代码 
十 分 接近 ,而 对 应 于 算法 过 程 第 12 行将 运算 数 压 栈 的 操作 ,程序 中 却 表 示 成 第 18 一 26 行 的 
嵌 套 分 支 语 句 。 原 因 是 rpn 中 的 运算 数 包含 符号 运算 数 x 和 N 以 及 字面 运算 数 , 需 要 区 别 
对 待 。 

接 下 来 实现 算法 2-9 的 EVENTUALLY-PERIODIC-SEQUENCE 过 程 。 


1 int mainO( 

2 unsigned x,N; 

3 char s(256]; /* 存 储 表 达 式 的 串 * / 

4 FILE * in=fopen('thap02/Eventuallyperiodicsequence/inputdata. txt", 't) , 

5 * out— fopen('thap02/Eventuallyperiodicsequence/outputdata. txt", 'w') ; 

6  assert(in&&out ; 

7  fgets(s,255,in ; / * 从 输入 文件 中 读 取 一 行 数据 * / 
8 while(1){ 

9 StrInputStream rpn; 

10 unsigned * f; 

11 int i=0,k=—1; 

12 initStrInputStream(&rpn.s) ; /* 用 s 初 始 化 串 输入 流 rpn * / 
13 readInt(&rpn,&-N); /< 提取 Nx/ 
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14 readInt(&rpn, & x) ; /< 提取 xx / 

15 rpn. begin— rpn. current; 

16 if(x— =08.8.N==0) / * NN、x 均 为 0, 运 行 结束 */ 

17 break; 

18 assert (Í— (unsigned * ) malloc( (N-- 1) * sizeof (unsigned) ; — / * 为 数组 了 分配 空间 * / 
19 f[i]— x—calculateC &rpn, x» ND ; / * A fGO  / 

20 while(k<0){ / * f[0. .让 中 无 重复 元 素 */ 

21 sisRewind(&rpn) ; /* 串 输入 流 复原 * / 

22 f[++i]=x=calculate(&-rpn,x,N); / * AE fi +-1Cx) * / 

23 k= linearSearch(f ,sizeof( unsigned) ,i, &-x , unsignedGreater) ; 

24 ) 

25 free(f) ; 

26 fprintf(out,"%d\n",i—k) ; /* 记录 周期 / 

27 fgets(s,255, in); / * 从 输入 文件 中 读 取 一 行 数据 * / 
28 ) 


29  ÍcloseCin) ;fcloseCout) ; 


30 return EXIT. SUCCESS; 


程序 2-15 ”实现 解决 Eventually periodic sequence 问题 的 C 程序 源 代码 


对 程序 2-15 的 说 明 如 下 。 

(1) 将 算法 EVENTUALLY-PERIODIC-SEQUENCE 过 程 实现 为 main 函数 。 与 算法 过 程 
一 样 ,函数 没有 参数 。 

(2) 与 算法 一 样 ,函数 中 设置 变量 x 和 N 表示 {(x) 的 自 变量 和 用 来 做 模 运算 的 模 。 文 
件 指针 LL A £2 分 别 指向 输入 文件 和 输出 文件 。 

G) 函数 代码 的 结构 与 算法 代码 的 结构 十 分 接近 。 第 12 行将 从 输入 文件 中 读 到 的 文 
本 行 s 初始 化 为 一 个 输入 流 rpn, 便 于 从 中 读 取 数据 。 

第 13 一 14 行 读 取 头 两 个 数据 N 和 n 后 ,第 15 行将 输入 流 的 起 点 定位 于 其 后 的 RPN 
的 起 始 位 置 。 

第 18 行为 存储 序列 FC e f* Co en f^ Cao 分 配 数组 { 空 间 。 由 于 函数 是 {0， 
1,…,N} 到 自身 的 映射 ,所 以 至 多 有 N 十 1 个 连续 各 不 相同 的 值 。 

第 19 行 调用 函数 calculate 根据 函数 的 逆 波 兰 表达 式 rpn 计算 其 在 x 值 处 的 函数 值 
f Go ,并 将 计算 结果 分 别 赋予 x 和 {[0]( 注 意 i 在 第 11 行 被 初始 化 为 0) 。 这 样 ,在 第 20 一 
24 行 的 while 循环 的 循环 体内 第 22 行 调用 函数 calculate 计算 函数 在 x 处 的 值 就 相当 于 计 
算 户 (z)，… 广 (z),… 并 存放 于 数组 工 的 对 应 元 素 。 对 计算 出 来 的 f(x) 的 值 ,第 23 行 调 
用 第 1 章 的 程序 1-3 中 的 linearSearch 函数 检测 广 (z) 是 否 在 f Co). f? GO m fh Ca) ih 
现 过 。 该 函数 在 数组 {[0. . i 一 1] 中 查找 值 为 x(x 一 产 (z)) 的 元 素 , 若 找到 ,返回 该 元 素 的 下 
标 ,否则 返回 一 1。 将 返回 值 赋予 k( 在 第 11 行 初 始 化 为 一 1) ,本 循环 的 循环 条 件 为 k<0 ,也 
就 是 f(x) 是 未 在 f(z) f Go P GO BUS. 

程序 2-14 和 程序 2-15 写 在 文件 夹 chap02\Eventually periodic sequence 中 的 源 代码 文 
件 Eventuallyperiodicsequence. c 中 。 
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2.3 队列 


2.3.1 队列 的 概念 及 其 链表 实现 


队列 的 FIFO 性 质 使 得 对 它 的 操作 就 像 注册 办 公 室 前 人 们 排 成 的 一 列队 伍 。 队 列 有 一 
个 队 首 和 一 个 队 尾 。 当 一 个 元 素 人 队 时 , 它 位 于 队列 之 尾 ,就 像 新 到 来 的 学 生 排 在 队 尾 。 出 
队 的 元 素 总 是 在 队 首 , 就 像 等 待 最 久 的 排 在 队 首 的 学 生 。 把 对 队列 的 INSERT 操作 称 为 
ENQUEUE, ,而 把 DELETE 操作 称 为 DEQUEUE。 如 同 栈 操作 POP. DEQUEUE 不 带 有 元 素 
参数 。 

图 2-9 说 明了 用 一 个 链表 工 实现 的 队列 Q。 一 个 队列 具有 属性 head[ Qj, 它 指向 其 队 
首 。 属 性 taiz[Q] 则 指向 队 尾 。 队 列 中 的 元 素 位 于 head[Q],…,tail[Q]。 当 head[Q]— 
tail[Q]= NIL 时 ,队列 为 空 。 当 队列 为 空 时 ,出 队 的 试图 导致 队列 的 下 游 。 用 链表 实现 队 
BRA E EM 

图 2-9(a) 是 具有 5 个 元 素 的 队列 。 图 2-9(b) 是 调用 了 ENQUEUE(Q, 17), ENQUEUE 
(Q,3) 和 ENQUEUE(Q,5) 后 该 队列 的 格局 。 图 2-9(c) 是 调用 DEQUEUE(Q) 后 该 队列 的 格 
局 。DEQUEUE(Q) 返 回 作为 队 首 的 关键 值 15。 新 的 队 首 具 有 关键 值 6。 


ener 
head|Q] taillQ] 
(a) 


ml ma TH 8 ead o ee aD 


head|Q] tail{Q] 
(b) 


Lus Ba o pa ma o rum-um 


head|Q] © tail|Q] 


2-9 一 个 用 链表 Q 实现 的 队列 


利用 对 带 有 哨兵 结 点 的 链表 的 操作 ,队列 的 操作 非常 简单 。 


ENQUEUE(Q,7) 

1 LIST-INSERT(Q,nil[L[Q]],z) 

2 if headLQ]— nilLLLQJ] 上 > 原 队列 为 空 
3 then head[ Q]--next[ nit[ LLQ1]] 

4 taillQ]- prev ni LEQ11] 

DEQUEUE(Q) 

1 if Q =Ø 


2 then error "underflow" 
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3 x<head[Q] 

4 head[ Q]-7next[ x] 
5 LIST-DELETE(Q. 2) 
6 return x 


算法 2-10 ”队列 的 人 队 和 出 队 操 作 算法 过 程 ENQUEUE 和 DEQUEUE 
图 2-9 说 明了 ENQUEUE 和 DEQUEUE 的 效果 。 每 一 个 操作 耗 时 都 是 O(1) 。 


2.3.2 队列 的 程序 实现 


在 C 语 言 中 ,定义 的 基于 链表 LinkedList 的 队列 数据 结构 如 下 。 


1 # include "list, h" 


2 typedef struct( /* 队列 类 型 * / 

3 LinkedList * L; /* 链 表 属 性 * / 

4 ListNode * head, * tail; /< 队 首 、 队 尾 属性 * / 
5 } Queue; 

6 Queue * createQueueO ; / * 创建 空 队列 * / 

7 void clrQueue(Queue * Q,void( * proc) (void * )); /* 清理 队列 空间 */ 
8 int queueEmpty(Queue * Q); / * 检测 队列 空 * / 

9 void enQueue(Queue * Q, void * k,int size); /* 人 队 操 作 * / 

10 ListNode * deQueue(Queue * Q); /* 出 队 操作 * / 


程序 2-16 定义 基于 链表 的 队列 类 型 及 声明 队列 操作 函数 的 头 文件 queue. h 


对 程序 2-16 的 说 明 如 下 。 

CD 第 2 一 5 行 定义 了 队列 类 型 Queue。 它 含有 一 个 作为 元 素 存储 载体 的 链表 类 型 属 
性 工 , 还 含有 两 个 分 别 指向 队 首 元 素 与 队 尾 元 素 的 指针 属性 head 与 tail, 

(2) 第 6 一 8 行 声明 的 函数 createQueue, clrQueue, queueEmpty 分 别 用 来 创建 一 个 空 
队列 ,清理 不 用 的 队列 的 存储 空间 和 检测 队列 是 否 为 空 。 

(3) 第 9 行 声 明 的 函数 enQueue 和 第 10 行 声明 的 函数 deQueue 是 实现 算法 2-10 的 入 
队 操作 ENQUEUE 过 程 和 出 队 操作 DEQUEUE 过 程 。 

实现 上 述 函 数 声明 的 定义 如 下 。 

1 # include<assert. h> 

2 #include "list. h" 

3 # include "queue. h" 

4 Queue * createQueue( unsigned long size) { 

5 Queue * Q= (Queue * )malloc(sizeof( Queue)) ; 


6 assert(Q) ; 

d Q->L=createList(size, NULL) ; /* 创建 链表 属性 * / 
8 Q->head= Q-»L-»nil-»next; /* 初始 化 队 首 */ 

9 Q->tail=Q->L->nil->prev; /* 初始 化 队 尾 * / 
10 return Q; 
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12 void clrQueue(Queue * Q,void( * proc) (void * )) { /* 清 理 队列 空间 * / 

13 Q->head= Q->tail= NULL; /* AR MRR ES * / 
14 clrList(Q->L, proc) ; / * 清理 链表 空间 x*/ 

15 free(Q->L); 

16 } 

17 int queueEmpty(Queue * Q){ / * 检测 队列 空 * / 

18 return listEmpty(Q->L); 

19 } 

20 void enQueue(Queue * Q,void * k){ /<* 人 队 操作 * / 

21 listPushBackCQ-»L.k) ; /* 在 链表 中 为 插入 */ 

22 if(Q->head= =Q->L->nil) /* 插入 新 结 点 前 队列 为 空 * / 
23 Q->head= Q->L->nil->next; 

24 Q->tail= Q->L->nil->prev; 

25) 

26 ListNode * deQueue(Queue * Q){ /* 出 队 操 作 */ 

27 assert( IqueueEmpty( Q0) ; / * BR AL Fit * / 

28 ListNode * x=Q->head; /*x RARE */ 

29 Q->head= x-»next; /* 设 置 新 的 队 首 */ 

30 listDelete(Q->L,x); /* 将 原 队 首 从 队列 中 摘 下 */ 
31 return x; 

32) 


程序 2-17 定义 队列 操作 的 源 代码 文件 queue. cpp 


对 程序 2-17 的 说 明 如 下 。 

COD 第 4 一 11 行 定义 的 函数 createQueue 通过 调用 createListC size. NULL) 函数 创建 一 
个 可 加 载 存 储 宽度 为 参数 size 的 元 素 的 链表 属性 工 , 由 于 队列 中 的 元 素 无 须 比 较 , 所 以 第 2 
个 参数 传递 NULL. J head 与 tail 属性 分 别 初始 化 为 L 的 表 首 与 表 尾 创建 一 个 空 队列 。 
第 12 一 16 行 定义 的 函数 clrQueue 对 不 再 使 用 的 队列 Q 调用 函数 clrList 清理 队列 的 属性 
L 的 空间 ,并 释放 。 

(2) 58 17—19 行 定义 的 函数 queueEmpty 通过 调用 listEmpty 检测 Q 的 L 属 性 是 否 为 
空 来 判断 队列 Q 是 否 为 空 。 

(3) 第 20 一 25 行 定义 的 函数 enQueue 实现 人 队 过 程 ENQUEUE, 第 26 一 32 行 定义 的 函 
数 deQueue 实现 出 队 过 程 DEQUEUE。 实 现代 码 与 伪 代 码 十 分 相似 ,读者 可 对 照 研读 。 


2.3.3 队列 的 应 用 


用 队列 来 解决 下 列 应 用 问题 。 
像素 转换 


问题 描述 
假设 以 二 维 数组 GOL .m,1. .nj 表示 一 幅 图 像 各 像素 的 颜色 , 则 GLi, 门 表示 区 域 中 点 
(i, 站 处 的 颜色 ,颜色 值 为 0 到 的 整数 。 下 面 的 算法 将 指定 点 (io ,jo) 所 在 的 同色 邻接 区 域 
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的 颜色 置换 为 给 定 的 颜色 值 。 约 定 所 有 与 点 (i0 .j0) 同 色 的 上 、 下 、 左 、 右 可 连通 的 点 组 成 
同色 邻接 区 域 。 

例如 ,一 幅 8X9 像素 的 图 像 如 图 2-10(a) 所 示 。 设 用 户 指定 点 (3,5) ,其 颜色 值 为 0, 此 
时 其 上 方 (2,5)、 下 方 (4.50 \ 右 方 (3,6) 邻 接点 的 颜色 值 都 为 0, 因 此 这 些 点 属于 点 (3,5) 
所 在 的 同色 邻接 区 域 ,再 从 上 .下 \ 左 \ 右 4 个 方向 进行 扩展 ,可 得 出 该 同色 邻接 区 域 的 其 他 
点 ( 见 图 2-10(a) 中 的 阴影 部 分 )。 将 上 述 同色 区 域 的 颜色 替换 为 颜色 值 7 所 得 的 新 图 像 如 
图 2-10(b) 所 示 。 


123456789 8 9 
1[5[4[5[4 112 1 1| 2 
2|2|5|5|3 2|1 2 2[1 
3[o0[3][2]3 ERE! 3 3|1 
4[2 B9 1 | 2|0 4 2|o 
5|1]9] 0|1 5 oji 
6| 0 21 6 2|! 
716 Lo 7 1|0 
8[6] ajs 8 als 
(a) 
图 2-10 像素 转换 
输入 数据 


输入 数据 组 织 在 文件 inputdata. txt 中 ,该 文件 包含 若干 个 案例 的 数据 。 每 个 案例 的 数 
据 由 5 EBC m vn io sjo newcolor 组 成 (数据 间 用 一 个 空格 隔 开 ) 的 一 行 开头 ,前 两 个 整数 
m 和 nn 表示 案例 中 矩阵 G 的 行 数 和 列 数 ,接着 的 两 个 整数 i。 和 jo 表示 图 像 数 据 列 阵 中 指 
定点 的 行 标 和 列 标 , 最 后 一 个 整数 newcolor 表示 把 含有 点 (in ,jo) 的 邻接 区 域 中 所 有 像素 转 
换 成 新 的 颜色 值 。 随 后 的 m 行 数据 每 行 包含 ”个 整数 (数据 间 用 一 个 空格 隔 开 ) ,表示 图 像 
数据 列 阵 G。 

输出 数据 

输出 数据 存放 在 文件 outputdata. txt 中 。 对 应 每 个 案例 的 输入 数据 ,输出 转换 后 的 图 
像 数 据 列 阵 G。 

输入 样 例 


33115 

123 

225 

242 
89357 
545431512 
255301321 
032300231 
201000020 
100003201 
010200221 
655010210 
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633400745 
输出 样 例 


153 

555 

542 

545431512 
255371321 
032377231 
271777720 
177773201 
017277221 
655017210 
633477745 


l. 算法 描述 


解决 一 个 案例 的 像素 转换 问题 的 基本 想法 是 利用 一 个 队列 Q, 初 始 时 将 指定 像素 点 
(ayjo) 加 入 队列 中 。 然 后 进入 一 个 循环 ,每 次 从 队列 中 将 队 首 出 队 , 设 为 (z,y), 然 后 将 
(xz,y) 的 颜色 值 置 为 werucolor。 接 着 在 数据 列 阵 G 中 搜索 (x,y) 的 左 、 右 、 上 、 下 相 邻 像素 点 
是 否 在 相 邻 区 域 中 ,若是 则 将 对 应 的 像素 点 加 入 队列 循环 直至 队列 Q 为 空 为 止 ,如 图 2-11 
所 示 。 

图 2-11 为 对 输入 样 例 的 第 一 个 案例 进行 像素 转换 的 过 程 。Q 表示 队列 , 浅 色 阴影 表示 
加 入 队列 Q 的 像素 。 图 2-11(a) 为 初始 时 ,指定 像素 点 (2,2) 加 入 队列 。 图 2-11(b) 为 循环 
的 第 一 次 重复 。 将 队 首 (2,2) 出 队 ,变换 颜色 ,并 将 与 其 相 邻 的 像素 (2,1) 和 (1,2) 加 入 队列 。 
图 2-11(c) 一 图 2-11(e) 为 循环 的 各 次 重复 。 


1 2 3 123 1) 2:3 
HAE 111 3 1 3 
2|2 [2] 5 lid 2 5 fend 2 5 rin 
3|12|4|2| of (2) 3|2|4|2| ef ania] 3 4} 2} Q/ 0,2) |B.) 
t t 
tail tail tail 
(a) (b) (c) 
| 3 123 
1 3 1|1 3 
2 5 ir 2 5 
3 4|2| 0|G.D 3 412| oo 
t 
tail 
(d) (e) 
图 2-11 对 输入 样 例 的 第 一 个 案例 进行 像素 转换 的 过 程 
将 上 述 算法 思想 描述 为 如 下 的 伪 代 码 过 程 。 


PIXEL-TRANSFORM(G, iy ,jo snewcolor) 
1 if Gi; ,jo ]=newcolor 
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2 then return 


3 m-—row(G] 
4 n--col[G] 
5 QO 户 创建 空 队列 


6 oldcolor*-GL i, ,jo 

7 ENQUEUE(Q, Cio +jo)) 

8 while not QUEUE-EMPTY(Q) 
9 do (x,y)<-DEQUEUE(Q) 


10 GLa, y]<newcolor 

11 if y—1>1 and G[x,y—1]=oldcolor DAW 
12 then ENQUEUE(Q,(z,y—1)) 

13 if y+1<n and GLx,y+1]=oldcolor DAW 
14 then ENQUEUE(Q, (x,y+1)) 

15 if z 一 1 过 1 and G[a—1,y]=oldcolor > Eä 
16 then ENQUEUE(Q, (x, y—1)) 

17 if z-- 1«n and G[x+1,y]=oldcolor DF 


18 then ENQUEUE(Q,(x+1,y)) 


算法 2-11 解决 像素 转换 问题 的 算法 过 程 PIXEL-TRANSFORM 


2. 程序 实现 


利用 程序 2-16 和 程序 2-17 ,不 难 写 出 解决 像素 转换 问题 的 程序 。 下 列 代码 仅 列 出 了 实 
现 算法 过 程 PIXEL-TRANSFORM 的 函数 pixelTransform, 完 整 的 程序 读者 可 打开 文件 夹 


chap02\pixeltransform 的 源 程序 文件 pixeltransform. c 研读 。 


1 typedef struct( 

2 int x; 

3 int y; 

4 }Point; 

5 void pixelTransform(int * G,int m,int n,int i0,int j0,int newColor) { 
6 if(G[iO * n+j0]= = newColor) 

7 return; 

8 Point p={i0,j0}; 

9 int oldColor=G[i0 * n4-j0]; 

10 Queue * Q=createQueue(sizeof( Point) ) ; 

11 enQueue(Q, &-p); 

12 while( ! queueEmpty(Q)) { 

13 memepy( &-p, deQueue( Q) ->key, sizeof( Point) ) ; 


14 G[p. x * n+p. y]=newColor; 

15 if(p. y—1>=08&8&.G[p. x * n+p. y—1]==oldColor) ( 
16 Point p0— (p. x.p. y— 1}; 

17 enQueue(Q, &-p0) ; 

18 ) 

19 if(p. y+1<n&&G[p. x * n+p. y+1]==oldColor) ( 
20 Point p0— (p. x-p. y+1)}; 


/* 像素 点 的 结构 * / 
/* 行 标 */ 
/< 列 标 * / 


/* 新 旧 颜 色相 同 * / 


/ * 指定 像素 * / 

/ * 指定 像素 的 原 有 颜色 * / 
/* 创建 空 队列 * / 

/< 指定 像素 人 队 * / 

/* 只 要 队列 非 空 * / 

/* 队 首 元 素 赋予 px*/ 

/* 改变 颜色 * / 

/* 左 邻 像 素 * / 

/* 创建 像素 点 pO*/ 

/* p0 AB */ 


/* 右 邻 像素 * / 
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21 enQueue(Q,&p0); 

22 ) 

23 — if(p. x—1>=08.8.G[(p. x—1) * n+p. y]— —oldColor) { /* 上 邻 像素 * / 
24 Point p0— (p. x—1.p. y) 

25 enQueue(Q, &-p0) ; 

26 ) 

27 if(p. x +1<m8-8.G[(p. x+1) * n+p. y]— —oldColor) ( /* 下 邻 像 素 * / 
28 Point p0— (p. x-- 1, p. y}; 

29 enQueue(Q, &-p0) ; 

30) 

31) 

32) 


程序 2-18 解决 像素 转换 问题 的 C 程序 源 代 码 文件 pixeltransform. c 


对 程序 2-18 的 说 明 如 下 。 

(1) 函数 pixelTransform 与 算法 过 程 PIXEL-TRANSFORM 相 比 ,表示 图 像 数 据 列 阵 二 
维 数组 G 被 声明 成 了 一 维 数组 。 这 是 因为 对 一 维 数组 元 素 的 访问 效率 高 于 对 二 维 数组 元 
素 的 访问 。 我 们 约定 : 按 行 优先 原则 ,用 一 维 数组 表示 二 维 数组 。 此 外 ,多 了 两 个 表示 列 阵 
G 的 行 数 和 列 数 的 参数 m 和 n, 这 是 因为 C 语言 中 数组 不 具有 长 度 (元 素 个 数 ) 的 属性 , 需 
要 加 以 说 明 。 这 样 ,在 代码 中 GLi * n 十 jj] 表示 二 维 数组 元 素 GL[Lij[j]。 

(2) 第 6 一 9 行 定 义 了 像素 点 数据 类 型 ,便于 像素 点 作为 队列 元 素 的 入 队 和 出 队 操 作 。 

(3) 由 于 C 语 言 中 的 数组 下 标 是 从 0 开始 编码 的 ,所 以 列 阵 G 的 行 标 范围 为 0 一 m 一 1， 
列表 范围 为 0 一 n 一 1 与 算法 过 程 中 1~m 及 1~mn 稍 有 不 同 ,这 体现 在 第 20 £1.58 24 (1.8 
28 行 和 第 32 行 的 对 像素 p 的 相 邻 像素 的 边界 检测 上 。 程 序 代 码 与 伪 代 码 十 分 相近 ,读者 
可 比较 研读 。 


2.4 二 又 搜 索 树 


2.4.1 二 叉 树 及 其 在 计算 机 中 的 表示 


1. 二 叉 树 概念 


二 又 树 是 递归 定义 的 。 一 棵 二 叉 树 T 是 一 个 定义 在 有 限 结 点 集合 上 的 结构 , 它 不 包含 
结 点 或 由 3 个 不 相交 的 结 点 集合 组 成 : 一 个 根 结 点 ,一 棵 称 为 左 子 树 的 二 叉 树 和 一 棵 称 为 
右 子 树 的 二 又 树 。 

不 含 结 点 的 二 又 树 称 为 空 树 或 零 树 ,有 时 表示 为 NIL。 若 左 子 树 非 空 ,其 根 称 为 整 棵 树 
的 根 的 左 孩 子 。 类 似 地 , 非 空 右 子 树 的 根 是 整 棵 树 的 根 的 右 孩子 。 若 一 棵 子 树 是 零 树 NIL， 
我 们 称 那 个 孩子 缺席 或 缺少 。 图 2-12(a) 展 示 了 一 棵 二 又 树 。 

在 一 棵 二 又 树 中 , 若 一 结 点 仅 有 一 个 孩子 ,要 讲究 该 孩子 的 位 置 是 左 孩 子 还 是 右 孩子 。 
图 2-12(b) 展 示 了 一 棵 由 于 结 点 位 置 而 与 图 2-12(a) 中 的 树 不 同 的 二 又 树 。 
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(a) (b) 
图 2-12 ”二叉树 


图 2-12(a) 为 一 棵 标准 形式 的 二 叉 树 。 结 点 的 左 孩 子 画 在 结 点 的 左下 方 , 右 孩子 画 在 结 
点 的 右 下 方 。 图 2-12(b) 为 一 棵 与 图 2-12(a) 中 的 二 叉 树 不 同 的 二 叉 树 。 在 图 2-12(a) 中 ， 
结 点 7 的 左 孩 子 是 5 而 其 右 孩 子 缺失 。 在 图 2-12(b) 中 , 结 点 7 的 左 孩 子 缺 失 而 右 孩子 是 
5。 作 为 二 又 树 ,它们 是 不 同 的 。 图 2-12(c) 为 用 一 棵 满 二 又 树 表 示 图 2-12(a) 中 的 二 又 树 。 
满 二 叉 树 是 指 一 棵 有 序 树 : 每 个 内 结 点 的 度数 为 2。 在 此 树 中 叶子 表示 为 方形 的 。 

二 又 树 中 位 置 的 信息 可 以 用 一 棵 有 序 树 的 内 结 点 来 表示 ,如 图 2-12(c) 所 示 。 其 思想 是 
将 二 叉 树 中 缺失 的 孩子 用 一 个 没有 和 孩子 的 结 点 替代 。 这 些 叶 子 结 点 在 图 中 表示 为 方形 。 结 
果 的 树 是 一 棵 满 二 叉 树 : 每 一 个 结 点 或 是 叶子 或 度数 为 2。 因 此 , 结 点 孩子 的 顺序 保存 了 位 
置信 息 。 

一 棵 完全 二 又 树 的 所 有 叶子 具有 相同 的 深度 并 且 所 有 的 内 结 点 度数 为 2。 图 2-13 展示 
了 一 棵 高 度 为 3 的 完全 二 叉 树 。 一 棵 高 度 为 h 的 完全 二 叉 树 有 多 少 片 叶子 呢 ? 根 结 点 有 2 
个 深度 为 1 的 孩子 ,其 中 的 每 一 个 有 2 个 深度 为 2 的 孩子 , 依 此 类 推 。 于 是 ,深度 为 h 的 叶 
子 的 数目 是 2*。 因 此 ,具有 片 叶 子 的 完全 二 又 树 的 高 度 为 lgn。 高 度 为 hh 的 完全 二 叉 树 
的 内 结 点 数目 是 


Li 
1 十 2 十 2 十 … 十 2 = 2)2: = 2-1 
于 是 ,完全 二 叉 树 有 2^ 1 个 内 点 。 


depth0 


depth1 


height-3 
depth2 


depth3 
2-13 一 棵 高 度 为 3 的 完全 二 叉 权 有 8 片 树叶 7 个 内 结 点 


在 计算 机 中 ,这 样 的 一 棵 树 可 以 用 链接 数据 结构 来 表示 。 在 这 个 数据 结构 中 ,每 个 结 点 
是 一 个 对 象 。 除 了 关键 值 域 key 和 卫星 数据 ( 结 点 中 除了 关键 值 以 外 的 数据 统称 为 结 点 的 
卫星 数据 ) 外 ,每 个 结 点 包含 域 left right A p 分 别 指向 对 应 于 左 孩 子 、 右 孩子 和 父亲 的 结 
点 。 若 缺少 孩子 或 父亲 , 则 结 点 对 应 的 域 包 含 值 NIL。 根 结 点 是 树 中 唯一 父亲 域 为 NIL 的 
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结 点 。 如 图 2-14 所 示 AEM p left Alright FERT 中 每 个 结 点 指向 其 父 结 点 EAT 
结 点 和 右 孩 子 结 点 的 指针 。 整 棵 树 T 的 根 用 属性 root LT His «5 root T]=NIL, WW ZZ RE 
HZ. 


图 2-14 二 叉 树 在 计算 机 中 的 表示 


图 2-14 中 每 一 个 结 点 z 具有 域 p[x] Cop) Left[xj( 左 下 ) 和 right[xj( 右 下 ), 没 有 展 


示 key 域 。 

对 二 又 树 的 最 基本 的 操作 是 遍历 , 即 访问 树 中 的 每 一 个 结 点 。 针 对 二 叉 树 的 递归 定义 ， 
可 以 按 如 下 顺序 来 逐一 访问 树 中 各 结 点 。 

CD 中 序 遍 历 。 从 根 结 点 开始 , 先 遍 历 当 前 结 点 的 左 子 树 , 然 后 访问 当前 结 点 ,最 后 遍 
历 右 子 树 。 


(2) 前 序 遍历 。 从 根 结 点 开始 ,首先 访问 当前 结 点 ,接着 遍历 左 子 树 ,最 后 遍历 右 子 树 。 
(3) 后 序 遍 历 。 从 根 结 点 开始 , 先 遍历 左 子 树 ,再 遍历 右 子 树 ,最 后 访问 当前 结 点 。 

下 列 伪 代 码 过 程 表 示 了 中 序 遍 历 ,前 序 遍 历 和 后 序 遍 历 过 程 读 者 可 仿照 描述 。 
INORDER-TREE-WALK (x) 

1 if zz NIL 

2 then INORDER-TREE-WALK (le ft[x]) 

3 print &ey[x] 

4 INORDER-TREE-WALK(right[ x ]) 


算法 2-12 ”对 以 c 为 根 结 点 的 二 叉 树 进行 中 序 遍 历 的 算法 过 程 INORDER-TREE-WALK 


遍历 一 棵 具有 nn 个 结 点 的 二 又 搜索 树 耗 时 OC) ,这 是 因为 初始 调用 后 ,该 过 程 对 树 中 的 每 
个 结 点 恰 被 调用 两 次 一 一 一 次 为 其 左 孩子 , 另 一 次 为 其 右 孩 子 。 


2. C 语言 中 二 叉 树 的 定义 
在 C 语 言 中 ,把 二 又 树 的 结 点 定义 成 如 下 结构 体 。 


1 £include— stdlib. h> 
2 typedef struct node( /* 二 叉 树 结 点 类 型 * / 
3 struct node * p; /=* 父 结 点 指针 = / 
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4 struct node * left; /* 左 孩子 结 点 指针 * / 

5 struct node * right; /* 右 孩子 结 点 指针 * / 

6 void * key; /* 数据 域 指 针 */ 

7 }BTreeNode; 

8 BTreeNode * creatBTreeNode(void * key,int size); /* 创建 结 点 * / 
9 void clrBTreeNode(BTreeNode * r,void( * proc) (void * )); /* 清理 二 叉 树 结 点 * / 
10 BTreeNode * creatBTree(void * k,int size, BTreeNode * l,BTreeNode* D; /* 创 建树 x*/ 
11 void clrBTree(BTreeNode * r,void( * proc) (void * )); /* 清理 二 叉 树 * / 
12 void inorderTreeWalk(BTreeNode * r,void ( * proc) (void * )) ; /* 中 序 遍 历 * / 
13 void preorderTreeWalk(BTreeNode * r,void ( * proc) (void * )); / * M3 * / 
14 void postorderTreeWalk(BTreeNode * r,void ( * proc) (void * )); / * 后 序 遍 历 * / 


程序 2-19 定义 二 叉 树 及 声明 遍历 函数 的 头 文件 binarytree. h 


对 程序 2-19 的 说 明 如 下 。 

OD 第 2 一 7 行 定义 了 表示 二 叉 树 结 点 的 结构 体 类 型 BTreeNode。 指 针 属性 p、left 和 
right 分 别 用 来 指向 本 结 点 的 父 结 点 , 左 孩 子 结 点 和 右 孩 子 结 点 。 指 针 属 性 key 用 来 指向 数 
据 域 ,指针 类 型 定义 为 void * 是 出 于 通用 性 考虑 。 

(2) 第 8 行 的 函数 creatBTreeNode 用 参数 key 指向 的 宽度 为 size 的 数据 创建 一 个 二 
又 树 结 点 ,第 9 行 的 函数 clrBTreeNode 用 来 对 不 再 使 用 的 结 点 进行 清理 ,避免 内 存 泄 漏 ,其 
中 函数 指针 参数 proc 用 来 清理 结 点 的 key 属性 空间 。 第 10 行 的 函数 creatBTree 创建 一 棵 
数据 域 初始 化 为 宽度 为 size ABLE kk 指引 的 数据 , 左 、 右 孩子 分 别 为 1 和 的 二 又 树 。 第 11 
行 的 函数 clrBTree 清理 二 又 树 的 存储 空间 ,以 防 内 存 泄漏 。 

G) 第 12 — 14 行 分 别 是 对 二 又 树 进行 中 序 遍 历 、 前 序 遍 历 和 后 序 遍历 的 函数 
inorderTreeWalk, preorderTreeWalk 和 postorderTreeWalk 的 声明 。 

定义 上 述 声 明 的 各 函数 如 下 。 


1 # include "binarytree. h" 


2 BTreeNode * creatBTreeNode(void * key,int size) { /x* 创建 结 点 */ 

3 BTreeNode * x— (BTreeNode * ) malloc(sizeof (BTreeNode)) ; / * 根 结 点 */ 

4 x->key= (void * ) malloc(size) ; /* 为 数据 域 分 配 空间 * / 

5 memcpy(x->key, key, size); /* 对 数据 域 进行 数据 复制 * / 
6 x->p= x->left=x->right= NULL; /* 结 点 指针 置 空 */ 

7 return x; 

8} 

9 void clrBTreeNode(BTreeNode * r.void( * proc) (void * )) { /* 清理 二 叉 树 结 点 * / 

10 r->p=r->left=r->right= NULL; 

11 if(proc) / * Xt key 域 深入 清理 */ 

12 proc(r->key); 

13 free(r->key); 

14 } 

15 BTreeNode * creatBTree(void * k,int size, BTreeNode * l,BTreeNode* r) { /=* 创 建树 * / 
16 BTreeNode * t= creatBTreeNode(k, size) ; / * ERAS RR / 

17 t->left=1; /* 设 置 根 结 点 的 左 孩子 * / 

18 — t-»right-r; /*# 设 置 根 结 点 的 右 孩子 * / 
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19 ifc 

20 l>p=t; /* 设 置 左 孩子 的 父 结 点 * / 
21 if(r) 

22 r-»p—t; /* 设 置 右 孩 子 的 父 结 点 * / 
23 return t; 

24) 

25 void clrBTree(BTreeNode * r,void( * proc) (void * )){ 

26 if (r->left) /* 清理 左 子 树 * / 

27 clrBTree(r->left, proc) ; 

28 if (r->right) /* 清理 右 子 树 * / 

29 clrBTree(r-»right, proc) ; 

30 clrBTreeNode(r, proc) ; [x 清理 本 结 点 */ 

31 free(r) ; 

32 } 

33 void inorderTreeWalk(BTreeNode * r.void ( * proc) (void * )) ( /* 中 序 遍 历 * / 

34 if(!r) 

35 return; 

36  inorderTreeWalk(r->left, proc) ; / * 中 序 遍 历 左 子 树 * / 
37 proc(r-»key); / x 中 序 访问 当前 结 点 * / 
38 inorderTreeWalk(r-»right. proc) ; /* 中 序 遍 历 右 子 树 / 
39 } 

40 void preorderTreeWalk(BTreeNode * r,void ( * proc) (void * )){ /x 前 序 遍 历 * / 

41: 

42) 

43 void postorderTreeWalk(BTreeNode * r,void ( * proc) (void * )){ /* 后 序 遍 历 * / 

44 i 

45) 


程序 2-20 C 语言 二 又 树 的 操作 函数 定义 文件 binarytree. c 


对 程序 2-20 的 说 明 如 下 。 

(1) 第 2 一 8 行 定义 了 创建 二 叉 树 结 点 的 函数 creatBTreeNode。 该 函数 首先 为 新 结 点 
指针 分 配 空间 (第 3 行 ) ,然后 为 结 点 的 数据 域 指针 key 分 配 空间 (第 4 行 ), 并 调用 库 函 数 
memcpy 将 参数 key 指引 宽度 为 size 的 内 存 数据 复制 到 结 点 的 属性 key 所 指引 的 内 存 地 址 
中 (第 5 行 )。 

将 新 结 点 的 父 结 点 , 左 孩 子 、 右 孩子 指针 初始 化 为 空 ( 第 6 行 ) 后 返回 新 结 点 指针 。 第 
15 一 24 行 定义 的 利用 已 存在 的 两 棵 二 叉 树 1 和 rr 以 及 指定 数据 创建 二 又 树 的 函数 
creatBTree 调用 本 函数 创建 新 的 二 叉 树 的 根 结 点 。 

(2) 第 9 一 14 行 定义 的 函数 clr BTreeNode 负责 将 不 用 的 结 点 空间 加 以 清理 。 由 于 结 
点 的 数据 域 key 可 能 含有 下 一 层 指 针 域 ,这 就 需要 做 深入 的 清理 ,利用 函数 指针 参数 proc 
来 完成 对 下 一 层 动态 空间 的 清理 (第 11 行 和 第 12 行 )。 第 25 一 32 行 定义 的 函数 clrBTree 
调用 本 函数 依次 (后 序 遍历 顺序 ?清理 树 中 每 个 结 点 的 空间 。 

(3) 第 33—39 行 定义 的 函数 inorderTreeWalk 实现 算法 2-10 中 的 对 二 叉 树 的 中 序 遍 
历 过 程 INORDER-TREE-WALK。 
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(4) 第 40 — 42 行 定义 的 函数 preorderTreeWalk 和 第 43 ~ 45 行 定 义 的 函数 
postorderTreeWalk 分 别 实现 对 二 叉 树 的 前 序 和 后 序 遍 历 。 为 节省 篇 幅 省 略 了 代码 细节 ， 
读者 可 打开 本 书 提供 相应 的 源 代码 文件 研读 。 


3. 应 用 

二 又 树 作为 一 种 数据 结构 ,可 以 用 来 作为 许多 应 用 问题 的 数据 模型 。 例 如 ,可 以 用 二 又 
树 来 表示 数学 表达 式 ,每 一 个 双 目 运算 可 以 表示 成 以 运算 符 为 @ 
根 、 第 一 个 运算 数 作为 左 孩子 .第 二 个 运算 数 作为 右 孩子 的 二 
又 树 。 对 于 单 目 运算 ,我 们 约定 : 运算 符 仍 表示 为 根 , 左 孩 子 置 © (3 
为 空 NIL ,运算 数 为 右 孩子 。 例 如 ,表达 式 a 十 6 一 c 可 用 图 2-15 ONE 
中 的 二 叉 树 表示 。 根 据 表达 式 二 又 树 的 结构 特点 ,运算 符 均 为 ”图 。.15 e ies 
树 中 的 内 点 ,而 运算 数 必 为 叶子 结 点 。 Sieh M 


作为 二 叉 树 的 应 用 , 试 考察 下 列 问题 。 
What Fix Notation 


There are three traversal methods commonly used in compilers and calculators: 

prefix 

infix 

postfix 

For example.a single expression can be written in each form 

infix: atb*c 

prefix: +a * be 

postfix: abe * + 

Note that prefix and postfix ARE NOT mirror images of each other! The advantage of 
prefix and postfix notations is that parentheses are unnecessary to prevent ambiguity. 

In our traversal the following symbols are operators with precedence rules going from 


highest to lowest; 


$ exponentiation 

x / multiply and divide 
+= add and subtract 
&| AND and OR 

! NOT 


Input and Output 

You are given two strings. The first string is the infix version of the expression. The 
second string is the prefix version of the expression. Determine the postfix version of the 
expression and print it out on a single line. 

All input will be single characters separated by a space. Output must be the same, 
single characters separated by a space. There are no special sentinels identifying the end of 


the data. 


73 


从 算法 到 程序 (第 2 NO 


Sample Input 


a 十 b 一 c 
t+a—be 


Sample Output 


INFIX => atb-c 
PREFIX  —--a—bc 
POSTFIX => ab c 一 十 


在 编译 系统 和 计算 器 中 需要 处 理 表达 式 , 表 达 式 根据 运算 符 与 运算 数 的 相对 位 置 分 成 
中 级 、 前 级 和 后 级 3 种 。 不 同 的 运算 符 , 运 算 的 优先 级 是 不 同 的 。 对 于 人 们 所 熟悉 的 中 级 表 
达 式 而 言 , 需 要 通过 加 括号 来 改变 运算 顺序 。 而 表达 式 一 旦 表示 成 了 前 绥 式 或 后 缀 式 ,就 不 
需要 括号 来 辅助 说 明 运 算 顺序 了 。 我 们 知道 ,一 个 表达 式 可 以 构成 一 棵 二 叉 树 。 仔 细 考 察 
不 难 发 现 ,对 表达 式 二 叉 树 进行 中 序 、 前 序 和 后 序 遍 历 刚好 生成 该 表达 式 的 中 缀 式 、 前 级 式 
和 后 级 式 。 例 如 ,对 图 2-15 所 示 的 二 又 树 进行 中 序 遍 历 、 前 序 遍 历 和 后 序 遍 历 的 结果 分 
别 为 

atb*c 

+a * bc 

abc * + 

本 问题 是 已 知 运算 符 的 优先 级 以 及 表达 式 的 中 绥 式 与 前 级 式 ,要求 给 出 表达 式 的 后 绷 
式 。 最 简单 的 解法 就 是 根据 前 缀 式 恢复 表达 式 二 叉 树 ,然后 对 生成 了 的 二 叉 树 进行 3 种 顺 
序 的 遍历 ,得 到 所 要 求 的 结果 一 一 表达 式 的 3 种 形式 。 

设 前 绥 式 表示 为 串 prefix 中 ,下 列 算法 描述 了 根据 prefix 创建 表达 式 二 又 树 的 过 程 。 

RESTOR-TREE( pre fix) 

lopetrators(4 $ 5 7, / 5-7, *—?,*&*,*|*, *j7) 

2 oprands-- Ø 

3 for each item in reverse of prefix 

4  doleft-right-- NIL 

5 if item € operators 

6 then if item #‘!’ 

7 then le ft<-POP(oprands) 

8 right*-POP(Coprands) 

9 PUSH(oprands, EXPRESSIONCitem, left, right)) 

10 return TOP(oprands) 


算法 2-13 解决 What Fix Notation 问题 中 根据 前 级 式 创建 二 叉 树 的 过 程 RESTOR-TREE 


注意 ,本 问题 中 只 有 一 个 一 元 运算 :逻辑 非 “1”。 其 他 所 有 的 运算 都 是 二 元 运算 。 也 就 
是 说 ,运算 符 一 仅 表示 减法 .而 没有 负 号 的 意义 。 所 有 的 运算 符 存储 在 集合 operators 中 , 设 
表达 式 的 前 缀 式 存 储 于 串 prefix 中 ,设置 一 个 运算 数 栈 oprands。 根 据 前 级 式 的 特点 ; 运 
算 符 表示 在 运算 数 之 前 ,对 pre fix 从 右 向 左 扫描 ,将 读 取 到 的 运算 数 压 和 人 栈 oprands 中 ,一 
且 读 取 到 运算 符 就 从 oprands 中 弹出 运算 数 ,合成 表达 式 作为 新 的 运算 数 压 人 oprands 中 。 
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第 9 行 中 过 程 EXPRESSION tem, left. right) 创建 一 棵 父亲 为 item, 左 、 右 孩子 分 别 为 
left 和 right 的 二 叉 树 。 若 prefix 包含 n 个 项 , 则 该 过 程 的 运行 时 间 为 O). 
利用 程序 2-13 和 程序 2-20, 在 C 语言 中 如 下 实现 算法 2-13。 


1 BTreeNode * restorTree(StrInputStream * sin){ 


2 char operators[]=" $ */+—&|!"; 

3 char item[10]; 

4 Stack* oprands— createStack(sizeof( BTreeNode * )); 

5 while! sisEof(sin)){ / [Br ref ie TET 
6 BTreeNode * left=NULL, * right- NULL. *opd; 

? readString(sin, item); // 读 取 一 项 

8 if(strstr(operators, item))( / is 

9 if(item[0]! ='!') // 是 二 元 运算 

10 left— * (BTreeNode * * )pop(oprands) 一 二 key; // 弹 出 左 运算 数 

11 right= * (BTreeNode * * )pop(oprands)—>key; // 弹 出 右 运 算数 

12 } 

13 opd=creatBTree(item, 10, left, right); // 创 建 二 叉 树 

14 push(oprands, &opd) ; // 压 入 新 的 运算 数 

15 } 

16 return * (BTreeNode * *)(pop(oprands)—>key); // 弹 出 栈 中 唯一 的 元 素 
17} 


程序 2-21 实现 算法 2-13 的 C 函数 


对 程序 2-21 的 说 明 如 下 。 

A) 第 1 一 17 行 定 义 的 函数 restorTree 实现 算法 2-13 的 RESTOR-TREE 过 程 。 由 于 需要 
从 前 缀 式 中 逆向 依次 读 取 运 算 项 ,所 以 参数 prefix 定义 成 在 第 1 章 的 程序 1-4 一 程序 1-6 中 开 
发 的 串 输 入 流 strstream 类 型 。 该 函数 返回 创建 好 的 表达 式 二 又 树 ( 见 程序 2-20) 。 

(2) 第 2 行将 运算 符 集合 定义 成 串 operators。 第 3 行 定义 的 字符 数组 item 用 来 接收 
prefix 中 的 数据 项 。 第 4 行 定义 了 栈 ( 见 程序 2-13)oprands 用 来 存储 运算 数 (运算 数 也 是 表 
达 式 ,所 以 栈 中 存储 的 是 二 又 树 指针 ) 。 

(3) 第 5 一 15 行 的 while 循环 对 应 算法 2-13 中 第 3 一 9 行 的 for 循环 ,依次 将 prefix( 已 
经 逆向 ) 中 各 项 读 到 item 中 。 第 8 一 12 行 的 证 语句 对 应 算法 2-13 中 第 5 一 8 行 的 证 语句 。 
注意 ,调用 子 串 查找 库 函 数 strstr 来 实现 检测 itemE{$，*，/, 十 , 一 , & |, 0s. ZA 
数 的 原型 是 

strstr(stringl, string2) 
声明 于 头 文件 生 string. h 字 中 。 其 功能 是 在 string] 中 查找 string2。 若 存在 ,返回 第 一 个 匹 
配 位 置 ,否则 返回 NULL. 

第 13 行 调用 程序 2-20 中 的 函数 creatBTree, 创 建新 的 表达 式 二 叉 树 , 压 人 栈 oprands。 

(4) 为 节省 篇 幅 , 此 处 没有 列 出 读 取 文 件数 据 调 用 restorTree 函数 的 主 函 数 , 读 者 可 打 
开 文件 夹 chap02\What Fix Notation 相应 的 源 文件 WhatFixNotation. c 研读 。 
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2.4.2 二 又 搜 索 树 


二 叉 搜 索 树 是 组 织 成 一 棵 二 又 树 的 全 序 集 (集合 中 的 任意 两 个 元 素 x 和 y ,关系 <y., 
z= 一 yz>y 中 有 且 仅 有 一 个 成 立 )。 如 图 2-16 所 示 , 二 叉 搜 索 树 的 一 个 关键 点 是 其 存储 方 
式 满 足下 列 二 叉 搜 索 树 性 质 : 

设 z 为 二 叉 树 中 的 一 个 结 点 。 若 > 是 x 的 左 子 树 中 的 一 个 结 点 , 则 key[y] 大 tey[z]。 
E y 是 xz 的 右 子 树 中 的 一 个 结 点 , 则 Rey ]EReyLy]. 

于 是 ,在 图 2-16(a) 中 , 根 结 点 的 关键 值 为 5, 其 左 子 树 中 的 关键 值 2.3 和 5 都 不 超过 5， 
而 其 右 子 树 中 的 关键 值 ? 和 8 都 不 比 5 小。 树 中 的 任 一 结 点 都 满足 此 性 质 。 例 如 ,图 2-16(a) 
中 的 关键 值 3 不 小 于 其 左 子 树 中 的 关键 值 2 且 不 大 于 其 右 子 树 中 的 关键 值 5。 二 又 搜索 树 
的 性 质 使 得 人 们 能 够 用 中 序 遍 历 算法 按 排序 顺序 打印 出 树 中 的 所 有 结 点 的 关键 值 。 作 为 一 
个 例子 ,中 序 遍 历 按 顺 序 2.3、5、5、7、8 打印 出 图 2-16 中 的 两 棵 二 叉 搜索 树 。 

在 二 又 搜索 树 中 对 任 一 结 点 xz, 其 左 子 树 内 的 各 关键 值 至 多 为 keyler], mE TR 
中 的 各 关键 值 至 少 为 key[z]。 同 一 个 集合 可 表示 为 不 同 的 二 叉 搜索 树 。 大 多 数 搜索 树 操 
作 的 最 坏 情形 运行 时 间 正 比 于 树 的 高 度 。 图 2-16(a) 为 6 个 结 点 高 度 为 2 的 一 棵 二 叉 搜 索 
树 。 图 2-16(b) 包 含 相同 关键 值 ,高 度 为 4 效率 稍 逊 的 一 棵 二 又 搜索 树 。 


(a) (b) 
2-16 ”二 叉 搜索 树 


2.4.3 ”二 又 搜索 树 的 查询 操作 


对 二 又 搜索 树 常用 的 操作 是 对 一 个 存储 在 树 中 的 关键 值 的 查找 。 除 了 SEARCH 操作 
以 外 ,二 又 搜索 树 还 支持 MINIMUM, MAXIMUM, SUCCESSOR 和 PREDECESSOR 等 查询 操 
作 。 本 节 中 ,将 考察 这 些 操作 并 说 明 每 个 操作 都 能 在 O(h) 时 间 内 被 支持 ,其 中 是 二 又 搜 
索 树 的 高 度 。 


1. 查找 


在 图 2-17 中 ,要 在 树 中 查找 关键 值 13 ,遵循 从 根 开始 的 路 径 15 一 6 一 7 一 13。 树 中 最 小 
关键 值 是 2, 它 可 以 通过 从 根 起 沿 指针 le fe 找到 。 通 过 从 根 起 沿 right 指针 找到 最 大 关键 值 
20。 关 键 值 为 15 的 结 点 的 后 继 是 关键 值 为 17 的 结 点 ,这 是 因为 它 是 15 的 右 子 树 的 最 小 关键 
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值 。 关 键 值 为 13 的 结 点 没有 右 子 树 , 因 此 其 后 继 
是 左 孩子 ,也 是 13 的 最 低 的 祖先 。 在 此 例 中 , 关 
键 值 为 15 的 结 点 就 是 它 的 后 继 。 

人 们 使 用 下 列 过 程 在 一 个 二 叉 搜 索 树 中 查 
找 给 定 关键 值 的 结 点 。 给 定 一 个 指向 该 树 的 根 
的 指针 x 和 关键 值 ,车 树 中 存在 关键 值 , 返 回 
一 个 指向 关键 值 为 的 指针 ;否则 返回 NIL. 

TREE-SEARCH (zx,k) 


1 while ANIL and k#key[zx] 
2 doif &key[x] 


图 2-17 对 二 叉 搜索 树 的 查找 


3 then z-—eft[x] 
4 else z-—right[x] 
5 return x 


算法 2-14 在 以 z 为 根 的 二 叉 搜索 树 中 查找 关键 值 为 & 的 结 点 的 TREE-SEARCH 过 程 


该 过 程 从 树 根 开始 查找 并 跟踪 自 顶 向 下 的 一 条 路 经 ,如 图 2-17 所 示 。 对 所 遇 到 的 每 一 
个 结 点 ,该 过 程 将 关键 值 & 与 Aey[z] 加 以 比较 。 若 两 个 关键 值 相等 ,查找 结束 。 若 & 小 于 
Aey[z] ,继续 在 zx 的 左 子 树 中 查找 ,这 是 因为 二 叉 搜 索 树 性 质 蕴涵 着 不 可 能 存储 在 右 子 
树 中 。 类 似 地 ,车 大 于 key[z], 继 续 在 右 子 树 中 查找 。 递 归 过 程 中 遇 到 的 结 点 形成 树 的 
一 条 从 根 开始 向 下 的 路 径 , 于 是 TREE-SEARCH 的 运行 时 间 是 OG ,其 中 六 是 树 的 高 度 。 


2. 最 小 值 与 最 大 值 


二 又 搜索 树 中 关键 值 最 小 的 元 素 总 能 通过 从 根 起 的 跟随 Left 孩子 直至 遇 到 NIL 而 找 
到 ,如 图 2-17 所 示 。 下 列 过 程 返回 指向 以 给 定 结 点 zx 为 根 的 子 树 中 的 最 小 元 素 的 指针 。 

TREE-MINIMUM (zx) 

1 while le ft{a2]ANIL 

2 doz-left[x] 


3 return 工 


算法 2-15 ”计算 以 c 为 根 的 二 叉 搜 索 树 中 最 小 关键 值 结 点 的 TREE-MINIMUM it 


二 又 搜索 树 的 性 质保 证 TREE-MINIMUM 是 正确 的 。 若 结 点 x 没有 左 子 树 , 则 因为 x 
的 右 子 树 中 的 每 一 个 关键 值 至 少 与 key[z] 一 样 大 ,以 z 为 根 的 子 树 的 最 小 关键 值 为 eey[z]。 
若 结 点 ae 有 左 子 树 , 则 因为 右 子 树 中 没有 结 点 的 关键 值 小 于 key[zj] 且 左 子 树 中 每 一 个 关键 
值 都 不 大 于 &ey[z] ,以 z 为 根 的 子 树 中 的 最 小 值 可 以 在 以 ze 产 [z] 为 根 的 子 树 中 找到 。 

TREE-MAXIMUM 的 伪 代 码 是 对 称 的 。 

TREE-MAXIMUM(Cr) 

1 while right[ x ]7* NIL 

2  doz-right[x] 

3 return x 


算法 2-16 计算 以 xz 为 根 的 二 叉 搜索 树 中 最 大 关键 值 结 点 的 TREE-MAXIMUM 过 程 
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这 两 个 过 程 对 高 度 为 h 的 树 的 运行 时 间 都 是 O(h), 如 在 TREE-SEARCH 中 那样 ,所 遇 
到 的 结 点 序列 构成 从 根 起 向 下 的 路 径 。 


3. 后 继 和 前 驱 


给 定 二 又 搜索 树 中 的 一 个 结 点 .能 找到 其 在 中 序 遍 历 生 成 的 排序 顺序 中 的 后 继 结 点 有 
时 是 很 重要 的 。 若 所 有 的 关键 值 相互 不 同 , 结 点 x 的 后 继 是 关键 值 大 于 key[zj] 的 结 点 中 关 
键 值 最 小 的 那 一 个 。 二 又 搜索 树 的 结构 无 须 比 较 就 可 以 确定 结 点 的 后 继 。 当 结 点 x 的 后 
继 存在 时 ,下 列 过 程 返回 后 继 结 点 , 若 zx 的 关键 值 是 树 中 最 大 的 , 则 返回 NIL. 

TREE-SUCCESSOR (x) 

1 if right x ANIL 

2 then return TREE-MINIMUM (right[ x]) 

3 y px] 

4 while yANIL and x— right y] 

5 doz~y 

6 yp[y] 


7 returny 


算法 2-17 在 二 叉 搜 索 树 中 计算 结 点 z 的 (全 序 关系 ) 后 继 的 过 程 TREE-SUCCESSOR 


TREE-SUCCESSOR 的 代码 在 两 种 情形 下 会 中 断 。 若 结 点 zx 的 右 子 树 非 空 , 则 z 的 后 继 
在 右 子 树 最 左边 的 结 点 ,这 在 第 2 行 调用 TREE-MINIMUM(right[x]) 来 找到 。 例 如 ,图 2-17 中 
关键 值 为 15 的 结 点 的 后 继 是 关键 值 为 17 的 结 点 。 

另 一 方面 , 若 结 点 x 的 右 子 树 为 空 而 有 后 继 y, 则 > 是 xz 的 前 辈 中 满足 左 孩 子 仍然 是 + 
的 前 辈 性 质 的 离 x 最 近 的 那 一 个 。 在 图 2-17 中 ,关键 值 为 13 的 结 点 的 后 继 是 关键 值 为 15 的 
结 点 。 为 了 找到 ,只 要 从 并 起 向 上 直至 遇 到 一 个 是 其 父亲 的 左 孩 子 的 结 点 ;这 由 TREE- 
SUCCESSOR 的 第 3 一 7 行 完成 。 

TREE-SUCCESSOR 对 高 度 为 h 的 树 的 运行 时 间 是 O) ,这 是 因为 人 们 或 沿 树 中 一 条 向 上 
的 路 径 ,或 沿 一 条 向 下 的 路 径 。 与 TREE-SUCCESSOR 对 称 的 过 程 是 TREE-PREDECESSOR, 其 运 
行 时 间 也 是 OC) 。 

即使 关键 值 不 是 各 不 相同 的 ,把 zx 的 后 继 与 前 驱 分 别 定义 为 由 调用 TREE-SUCCESSOR (x) 
和 TREE-PREDECESSOR(z) 返 回 的 结 点 。 


2.4.4 二 又 搜索 树 中 元 素 的 增删 


插入 和 删除 操作 会 导致 用 二 又 搜索 树 表 示 的 动态 集合 发 生变 化 ,而 数据 结构 也 会 反映 
这 一 变化 ,但 二 又 搜索 树 的 性 质 应 仍然 成 立 。 后 面 将 会 看 到 ,为 插入 一 个 新 的 元 素 而 对 树 的 
修改 是 比较 直接 的 ,但 对 删除 操作 的 处 理 稍 许 复杂 一 点 。 


1. 插入 


为 在 二 又 搜索 树 工 中 插入 一 个 新 的 值 w, 利 用 过 程 TREE-INSERT。 该 过 程 传递 一 个 结 
Hoz key[z]—v.left[z]— NIL. H. right[z]— NIL, CREM T Ale 的 一 些 域 使 得 > 插 


78 


第 2 章 数据 结构 基础 


入 到 树 的 合适 的 位 置 上 。 


TREE-INSERT(T. z) 

1 y+ NIL 

2 x-—root[ T] 

3 while «ANIL 

4 do yc 

5 if key[ z]—bey[x] 

6 then x<le ft x] 

7 else z-—righi x] 

8 plz] 

9 if y=NIL 

10 then root(T]<z bp 了 是 空 的 
11 else if key[z]<key[y] 

12 then le fil y]<-z 
13 else right[ y ]<z 


算法 2-18 在 二 叉 搜索 树 T PABA z 的 过 程 TREE-INSERT 


图 2-18 所 示 为 在 二 又 搜索 树 中 插入 一 个 关键 值 为 13 的 项 。 浅 阴影 结 点 表示 从 根 起 向 
下 到 该 项 要 搬入 的 位 置 的 路 径 。 虚 线 表 示 搬 入 该 
项 时 要 加 入 的 连接 。 

图 2-18 展示 了 TREE-INSERT 的 运行 。 就 像 过 
程 TREE-SEARCH 那样 ,TREE-INSERT 从 树 的 根 开 
始 跟踪 一 条 向 下 的 路 径 。 指针 c 跟踪 此 路 径 , 并 维 
持 指 针 > 为 x 的 父亲 。 初始化 后 ,第 3 一 7 行 的 
while 循环 导致 两 个 指针 向 树 的 下 方 移动 ,向 左 还 图 2-18 在 二 又 搜索 树 中 插入 一 个 
是 向 右 取决 于 key[z] 和 key[z] 的 比较 结果 ,直至 x TNCS 13 的 项 
为 NIL。 此 NIL 占据 了 和 希望 放置 输入 = 的 位 置 。 第 8 一 13 行 设置 使 得 > 插入 各 个 指针 。 

就 像 搜索 树 上 的 其 他 基本 操作 一 样 ,过 程 TREE-INSERT 在 高 度 为 h 的 树 上 的 运行 时 间 
是 O(h)。 


2. 删除 


从 二 叉 搜索 树 中 删除 指定 结 点 z 的 过 程 以 指向 = 的 指针 作为 参数 。 该 过 程 要 考虑 图 2-19 
展示 的 3 种 情形 。 若 = 无 孩子 ,将 其 父亲 p[z] 指 向 = 的 指针 改 为 NIL。 若 该 结 点 仅 有 一 个 
孩子 ,通过 在 其 孩子 与 其 父亲 之 间 建 立新 的 连接 来 删除 *。 最 后 , 若 该 结 点 有 两 个 孩子 , 先 
删 掉 z 的 后 继 结 点 y, 它 没有 左 孩 子 ( 这 是 因为 z 有 右 孩 子 , 其 后 继 y 为 右 子 树 中 的 最 小 者 ， 
故 y 无 左 孩子 ) ,然后 用 y 的 关键 值 和 卫星 数据 蔡 代 = 的 关键 值 和 卫星 数据 。 

TREE-DELETE 的 代码 对 3 个 情形 的 组 织 稍 有 不 同 。 


TREE-DELETE (T.z) 

1 if Zeft[ z] — NIL or right[ z]— NIL 
2 then yz 

3 else y-- TREE-SUCCESSOR(z) 
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4 if leftLy] 75 NIL 

5 then 2<-le ftLy] 

6 else z-—right[ y] 

7 if zANIL 

8 then p[ z]-—5[y] 

9 if p[y]=NIL 

10 then rootlT]<x 

11 else if y=le fel ply]] 


12 then le ft[ ply ]]<—2x 
13 else right[ ply ]]<—x 
14 if y#z 


15 then key[z]<keyLy] 
16 将 y 的 卫星 数据 复制 到 > 中 
17 return y 


算法 2-19 从 二 又 搜索 树 T 中 删除 结 点 的 过 程 TREE-DELETE 


在 第 1 一 3 行 中 ,算法 确定 要 删除 的 结 点 y。 结 点 y 或 是 输入 结 点 z( 若 = 至 多 有 一 个 孩 
子 ) 或 是 = 的 后 继 ( 若 > 有 两 个 孩子 ) 。 然 后 ,在 第 4 一 6 行 中 , 设 zx 为 y WAR NIL 孩子 , 若 y 
没有 孩子 则 设 z 为 NIL。 在 7 一 13 行 中 通过 设置 p[y] 和 x 中 的 指针 将 y 删除 。 对 处 理 
Zz 二 NIL 或 y 为 树 根 这 样 的 边界 条 件 ,y 的 删除 稍微 要 复杂 点 。 最 后 ,在 第 14 一 16 行 , 若 删 
除 的 是 x 的 后 继 , 则 要 将 y 的 关键 值 和 卫星 数据 移 到 > 处 ,覆盖 原先 的 关键 值 和 卫星 数据 。 
结 点 y 在 第 17 行 返 回 ,使 得 主 调 过 程 能 将 其 释放 到 空闲 表 中 。 本 过 程 对 高 度 为 h 的 树 的 运 
行 时 间 为 O(h)。 

图 2-19 为 从 二 叉 搜 索 树 中 删除 结 点 =。 哪 个 是 真正 要 删 掉 的 结 点 取决 于 x 有 和 多少 孩 
子 ; 此 结 点 表 为 浅 阴影 的 。 图 2-19(a) 说 明 若 = 无 孩子 ,直接 删除 =。 图 2-19(b) 说 明 若 = 仅 
有 一 个 孩子 ,删除 =。 图 2-19(c) 说 明 若 x 有 两 个 孩子 ,删除 其 后 继 y, 它 至 多 有 一 个 孩子 ， 
然后 用 y 的 关键 值 和 卫星 数据 蔡 代 = 的 关键 值 和 卫星 数据 。 

我 们 已 经 说 明了 对 二 叉 搜 索 树 的 所 有 基本 操作 都 运行 于 O(h) 时 间 , 其 中 是 该 树 的 高 
度 。 然 而 , 随 着 项 的 插入 和 删除 ,二 叉 搜索 树 的 高 度 是 变化 的 。 例 如 ,车 各 项 按 严 格 增 加 的 
顺序 一 一 插入 , 树 就 成 了 高 度 为 n 一 1 的 链表 了 。 假 定 所 有 的 关键 值 各 不 相同 ,可 以 将 nn 个 
关键 值 随 机 地 创建 一 棵 二 又 搜索 树 ,其 高 度 值 可 期 望 为 Ol(lgn)。 即 使 如 此 ,对 这 样 的 一 棵 
初始 “平衡 "的 二 叉 搜 索 树 ,经 过 若干 次 插入 、 删 除 操作 后 很 难保 持 它 的 平衡 性 。2. 4. 5 节 讨 
论 一 种 具有 “ 自 维护 ”功能 的 平衡 二 叉 搜 索 树 : 在 插入 和 删除 操作 后 都 会 调整 树 的 结构 ,使 
得 既 保 持 二 又 搜索 树 的 性 质 , 又 保持 左 、 右 子 树 的 基本 平衡 。 


2.4.5 红 - 黑 树 及 其 性 质 


红 - 黑 树 是 一 棵 二 又 搜索 树 ,每 个 结 点 存储 了 它 的 颜色 ,可 以 是 红色 或 者 黑色 。 通 过 限 
制 从 根 到 叶子 的 路 径 上 的 结 点 的 着 色 方式 来 保证 没有 任何 这 样 的 路 径 的 长 度 是 其 他 路 径 的 
两 倍 ,使 得 该 树 大致 平 衡 。 

该 树 的 每 个 结 点 包含 有 域 color key left right 以 及 p。 若 某 结 点 的 孩子 或 父亲 不 存 
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(a) 


a 


off 


=== 二 


(e) 
图 2-19 从 二 叉 搜索 树 中 删除 结 点 = 


在 , 结 点 所 含 的 相应 的 指针 域 包含 值 NIL。 我 们 将 把 这 些 NIL 值 视 为 指向 二 又 搜索 树 的 外 
结 点 (树叶 ) 的 指针 ,而 那些 含有 关键 值 的 结 点 视 为 树 的 内 结 点 。 

一 棵 二 又 搜索 树 为 红 - 黑 树 , 若 其 满足 下 列 红 - 黑 树 性 质 。 

(1) 每 个 结 点 非 红 即 黑 。 

(2) 根 是 黑色 的 。 

(3) 每 一 片 叶 子 是 黑色 的 。 

OD 若 一 结 点 是 红色 的 , 则 其 孩子 是 黑色 的 。 

(5) 对 每 个 结 点 而 言 ,所 有 从 该 结 点 起 到 后 代 叶 子 的 路 径 含 有 同样 多 的 黑色 结 点 。 

图 2-20 展示 了 一 棵 红 - 黑 树 的 例子 。 

图 2-20 为 一 棵 红 - 黑 树 ,黑色 结 点 是 黑色 的 ,红色 结 点 带 有 阴影 。 红 - 黑 树 中 的 每 一 个 结 
点 非 红 即 黑 , 红 色 结 点 的 孩子 都 是 黑色 的 ,从 一 结 点 起 到 其 后 代 叶 子 的 每 一 条 简单 路 径 含有 
相同 多 的 黑色 结 点 。 图 2-20(a) 中 每 一 片 叶子 展示 为 NIL, 是 黑色 的 。 每 一 个 非 NIL 结 点 
标注 了 它 的 黑色 高 度 ; NIL 的 黑色 高 度 为 0。 图 2-20(b) 中 同一 棵 红 - 黑 树 不 过 把 所 有 的 
NIL 替换 成 单一 的 哨兵 nii[TJj, 它 总 为 黑色 ,并 忽略 它 的 黑色 高 度 。 根 的 父亲 也 是 哨兵 。 
图 2-20(c) 中 同一 棵 红 - 黑 树 忽略 所 有 的 叶子 和 根 的 父亲 。 在 本 章 其 余部 分 将 使 用 这 一 表示 
AX. 

为 方便 红 - 黑 树 代码 中 对 边界 条 件 的 处 理 , 用 单一 的 哨兵 来 表示 所 有 的 NIL。 对 一 棵 
红 - 黑 树 工 而 言 , 哨 兵 wzLT] 是 一 个 具有 树 中 普通 结 点 的 相同 域 的 对 象 。 其 颜色 域 为 
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nil|T| 


图 2-20 一 棵 红 - 黑 树 


BLACK , M HALI p left right 和 key 可 以 设 为 任意 值 。 如 图 2-20(b) 所 示 , 所 有 指向 NIL 
的 指针 均 用 指向 哨兵 niz[TJ 的 指针 代替 。 

利用 哨兵 ,可 以 把 某 结 点 z 的 NIL 孩子 当成 与 普通 结 点 一 样 来 处 理 , 其 父亲 是 ns Hi 
然 并 不 在 树 中 为 每 个 NIL 添加 一 个 不 同 的 哨兵 ,以 使 得 每 个 NIL 的 父亲 都 明确 定义 ,这 样 
的 方法 会 浪费 空间 。 使 用 一 个 哨兵 nil LT JK RR AB TA. NIL 一 一 树叶 和 根 的 父亲 。 哨 
的 域 le ft right R key 没有 ,但 在 代码 过 程 中 有 时 为 方便 会 对 它们 加 以 设置 。 

一 般 来 说 ,人 们 仅 对 红 - 黑 树 中 的 内 结 点 感 兴趣 ,因为 这 些 结 点 存 有 关键 值 。 在 本 章 的 
余下 部 分 ,将 在 画 红 - 黑 树 时 省 略 叶子 ,如 图 2-20(c) 所 示 。 

人 们 把 从 一 个 结 点 工 起 ,但 不 包含 此 结 点 ,向 下 到 一 片 叶子 的 路 径 中 所 含 的 黑色 结 点 
数 称 为 该 结 点 的 黑色 高 度 , 记 为 bhCz)。 根 据 性 质 5, 黑 色 高 度 的 概念 是 良好 定义 的 ,因为 


A FE 


所 有 从 该 结 点 向 下 的 路 径 含 有 相同 多 的 黑色 结 点 。 人 们 定义 红 - 黑 树 的 黑色 高 度 为 其 根 的 
黑色 高 度 。 为 说 明 红 - 黑 树 的 高 度 性 质 ,引入 下 列 命题 。 
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引 理 2-1 红 - 黑 树 中 以 任何 结 点 xz 为 根 的 子 树 至 少 包含 2bh(z) 一 1 个 内 结 点 。 

证 明 对 z 的 高 度 做 数学 归纳 。 若 z 的 高 度 刀 为 0, 则 2 必 为 一 片 叶子 CaiLT]) ,以 
工 为 根 的 子 树 至 少 包含 209 —1—2* —1—0 AAR. BUER T Eh h>) W 
题 为 真 ,考虑 zx 是 一 个 高 度 为 h 上 且 具 有 两 个 孩子 的 内 结 点 。 每 个 孩子 的 黑色 高 度 视 其 颜色 
是 红 还 是 黑 分 别 为 bh(z) 或 bh(z) 一 1。 由 于 z 的 孩子 的 高 度 小 于 z 本 身 的 高 度 , 人 们 可 以 
把 归纳 假设 施 于 每 个 孩子 得 出 每 个 孩子 至 少 有 MOO 一 1 个 内 结 点 。 于 是 ,以 z 为 根 的 子 
WESS IP DE (IN — 1) + (2-1 - 1) 31-2909 —1 个 内 结 点 ,这 就 证 明了 该 命题 。 

538 2-2. 一 棵 具有 nn 个 内 结 点 红 - 黑 树 的 高 度 至 多 为 2lg(n 十 1)。 
证 明 设 有 为 树 的 高 度 , 按 性 质 4, 从 根 到 一 片 叶 子 的 任 一 路 径 上 ,不 包括 根本 身 ,至 少 
有 一 半 的 结 点 是 黑色 的 。 根 据 引 理 2-1, 根 的 黑色 高 度 至 少 为 h/2; 于 是 : 
n> 2? —] 
将 BREA mT AS Ign + D 29/2 3X h<2lg(n +1), 

此 引 理 的 直接 结果 是 动态 集合 的 操作 SEARCH, MINIMUM, MAXIMUM, SUCCESSOR 和 
PREDECESSOR 能 在 O(lgn) 时 间 内 实现 于 红 - 黑 树 。 这 是 因为 它们 可 以 对 一 棵 高 度 为 h 的 二 
叉 搜 索 树 运行 于 O(h) 时 间 内 ,而 根据 引 理 2-2, 任 一 具有 个 结 点 的 红 - 黑 树 高 度 为 O(lgn) 。 

虽然 对 二 又 搜索 树 的 TREE-INSERT 和 TREE-DELETE 对 给 定 的 作为 输入 的 红 - 黑 树 能 
在 O(lgz) 时 间 内 运行 ,但 不 能 保证 发 生 了 改变 的 二 叉 搜索 树 仍 将 为 一 棵 红 - 黑 树 。 这 就 是 
下 面 要 深入 讨论 的 内 容 。 


2.4.6 红 - 黑 树 的 操作 
1. 旋转 


搜索 树 操作 TREE-INSERT 和 TREE-DELETE 对 一 棵 红 - 黑 树 运行 时 , 耗 时 Ogn), M 
于 改变 了 树 的 结构 ,结果 就 可 能 违背 红 - 黑 树 性 质 。 为 恢复 这 些 性 质 ,必须 改变 树 中 某 些 结 
点 的 颜色 还 要 改变 指针 结构 。 

图 2-21 所 示 为 对 二 又 搜索 树 的 旋转 操作 。 操 作 LEFT-ROTATE(T,z) 通 过 改变 常数 个 
指针 将 左边 两 个 结 点 的 格局 转换 为 右边 的 格局 。 可 以 通过 逆 操 作 RIGHT-ROTATECT , y) 
右边 的 格局 转换 成 左边 的 格局 。 字 母 Bly 表示 各 子 树 。 旋 转 保 留 了 二 又 搜索 树 性 质 :c 
中 的 关键 值 先 于 Rey[z] ,而 keyLzj 先 于 B 中 的 关键 值 ,8 中 的 关键 值 先 于 key[Lyj.keyLyj 又 
先 于 7 中 的 关键 值 。 

人 们 通过 旋转 来 改变 指针 结构 ,这 是 在 搜索 树 中 的 保留 二 又 搜索 树 性 质 的 局 部 操作 。 
图 2-21 展示 了 两 种 情形 的 旋转 : 左旋 转 和 右 旋 转 。 对 结 点 zx 做 一 次 左旋 转 时 ,假定 其 右 孩 
F y PÆ nill T]; 可 以 是 树 中 任 一 右 孩 子 不 为 nil[ 了 Tj 的 结 点 。 左 旋转 将 z“ 轴 转 ” 连 接 到 
y。 这 使 得 y 为 子 树 新 的 根 ,而 zz 为 y 的 左 孩 子 而 y 的 左 孩 子 作 为 x 的 右 孩 子 。 

LEFT-ROTATE 的 伪 代 码 中 假定 right[xj] 关 nil[Tj 且 根 的 父亲 为 nil T]. 


LEFT-ROTATE(T,x) 
1 y-righilx] DER 
2 right x ]--1eft y1 DH y 的 左 子 树 转换 成 z 的 右 子 树 
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B Y a B 
图 2-21 对 二 又 搜索 树 的 旋转 操作 


3 pLieftLy1]-7 

4 pLy]- 5x] 上 将 z 的 父亲 连接 到 y 的 父亲 
5 if pLz]=ni[LT] 

6 then root T ]-—y 

7 else if x=le ft p[ 1] 

8 then left px 1]-—» 

9 else right( px ]]*7-» 

10 le ftLy]<—x 上 将 工 置 于 y 的 左 孩 子 

11 pll 


算法 2-20 ”对 红 - 黑 树 T PA x 进行 左旋 转 操作 的 过 程 LEFT-ROTATE 
图 2-22 展示 了 LEFT-ROTATE 操作 , 它 与 RIGHT-ROTATE 的 代码 是 对 称 的 。LEFT- 


ROTATE 和 RIGHT-ROTATE 均 运行 于 O(1) 时 间 内 。 旋 转 只 改变 指针 ,其 他 所 有 域 都 保持 
不 变 。 


e» 
© — 0» Q9 


2-22 过程 LEFT-ROTATE(T,z) 如 何 改变 二 叉 搜索 树 的 例子 


2. 插入 


在 一 棵 红 - 黑 树 中 插入 一 个 结 点 可 以 在 O(lgn) 时 间 内 完成 。 利 用 对 TREE-INSERT 过 程 
的 一 个 轻微 修改 版 本 将 一 个 结 点 = 像 在 普通 二 又 搜 索 中 那样 插入 到 红 - 黑 树 T 中 ,然后 将 > 
着 成 红色 。 为 保证 维持 红 - 黑 树 性 质 ,调用 一 个 辅助 过 程 来 对 各 结 点 重新 着 色 并 执行 旋转 。 
调用 RB-INSERT(T,<) 将 其 key 域 假定 已 经 填写 好 的 结 点 < 插入 到 红 - 黑 树 工 中 。 
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RB-INSERT(T, =) 

1 y+nillT] 

2 x-root[ T] 

3 while r#nil[T] 

4 do yez 

5 if key z] key x] 

6 then z-—eft[x] 

7 else z-—right[ x] 

8 plel<y 

9 if y—ni[ T] 

10 then root[ T] 

1 else if key x] keyLy] 

12 then le ftLy]<z 
13 else rightLy]<-z 
14 left[ z]*7ni T] 

15 right[ z]-nil[ T] 

16 color[ z]-- RED 

17 RE-INSERT-FIXUFC T. z) 


算法 2-21 在 红 - 黑 树 T 中 插入 结 点 = 的 过 程 RB-INSERT 


过 程 RB-INSERT 和 TREE-INSERT 之 间 有 4 个 不 同 点 。 第 一 ,所 有 的 NIL 实例 都 替换 
成 了 ni[T]。 第 二 ,为 维护 正常 的 树 结构 ,在 RB-INSERT 的 第 14 一 15 行将 left VI righi[ 2] 
设 为 nil[T]。 第 三 ,在 第 16 行将 = 着 成 红色 。 第 四 ,因为 = 着 成 红色 可 能 导致 红 - 黑 树 性 质 
之 一 被 违背 ,在 RB-INSERT 的 第 17 行 调 用 RB-INSERT-FIXUP(T,x) 来 恢复 红 - 黑 树 性 质 。 
RP-INSERT-FIXUP( T. 2) 


1 while color{ p[ z]]— RED 
2 doif p[ z]—leftL pL pL z1]] 


3 then y-—right pL pUz11] 

4 if colorL y] - RED 

5 then color[ p[2]]-- BLACK 上 情形 1 
6 color[ y]-- BLACK 上 > 情形 1 
7 color[ pL pLz]]]-- RED D tHE 1 
8 z+ pLpLz1] DEI 
9 else if z— right[ p[z]] 

10 then z<—p[z] 上 > 情形 2 
11 LEFT-ROTATE(T.z) DHE 2 
12 color{ plz] ]--BLACK b ES 
13 color[ pL p[z]]]-- RED 上 > 情形 3 
14 RIGHT-ROTATE(T, p[ p[ 21) 上 > 情形 3 


15 else (与 then 短语 一 样 但 交换 right 和 left) 
16 color[ root T] ]-- BLACK 


算法 2-22 插入 结 点 后 恢复 红 - 黑 树 性 质 的 过 程 RB-INSERT-FIXUP 
为 理解 RB-INSERT-FIXUP 是 如 何 工作 的 ,将 分 成 3 个 步骤 来 考察 代码 。 首 先 ,要 确定 
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RB-INSERT 将 = 插入 并 将 其 着 成 红色 而 导致 的 对 哪 一 条 红 - 黑 树 性 质 的 违背 。 其 次 ,将 考察 
第 1 一 15 行 的 while 循环 的 整体 目标 。 最 后 ,将 探索 3 种 情况 ?中 的 哪 一 个 使 得 while 循环 
中 断 , 并 弄 清楚 它们 是 如 何 完成 目的 的 。 图 2-23 展示 了 RB-INSERT-FIXUP 对 一 个 红 - 黑 树 
样本 的 操作 。 

调用 RB-INSERT-FIXUP 可 能 对 哪 一 条 红 - 黑 树 性 质 有 违背 呢 ? 性 质 1 肯定 会 仍然 成 
立 , 性 质 3 也 是 如 此 ,这 是 因为 新 插入 的 红色 结 点 的 孩子 都 是 哨兵 LT]。 人 性 质 5 说 的 是 
从 给 定 结 点 起 的 任意 一 条 路 径 上 含有 相同 多 个 黑色 结 点 ,也 是 满足 的 ,这 是 因为 结 点 x 是 红 
色 的 且 带 有 哨兵 孩子 。 于 是 ,可 能 被 违背 的 性 质 仅 有 性 质 2, 它 要 求 根 是 黑色 的 ,以 及 性 质 
4, 它 说 的 是 红色 结 点 不 能 有 红色 和 孩子。 所 有 可 能 的 违背 都 是 因为 = 被 着 成 红色 的 。 若 = 是 
根 , 则 性 质 2 被 违背 , 若 z 的 父亲 是 红色 的 , 则 性 质 4 被 违背 。 图 2-23(a) 展 示 了 插入 结 点 z 
后 性 质 4 被 违背 的 情形 。 


图 2-23 RE-INSERT-FIXUP 的 操作 


图 2-23 所 示 为 RB-INSERT-FIXUP 的 操作 。 图 2-23(a) 为 插入 后 的 结 点 z=。 由 于 < 及 其 
父亲 p[xj 都 是 红色 的 ,违背 了 性 质 4。 由 于 < 的 叔叔 y 是 红色 的 ,应 用 代码 中 的 情形 1。 结 
点 被 重新 着 色 指 针 S 上 移 ,结果 显示 在 图 2-23(b)。 同 样 ,= 及 其 父亲 都 是 红色 的 ,但 x nds 
叔 是 黑色 。 由 于 > 是 加 [zx] 的 右 孩 子 , 应 用 情形 2。 执 行 一 次 左旋 转 ,结果 显示 在 图 2-23(c) 。 
现在 > 是 其 父亲 的 左 孩 子 ,应 用 情形 3。 一 次 又 旋转 得 出 的 树 在 图 2-23(d) 中 ,这 是 一 棵 合 


D 情况 2 会 变 成 情况 3, 所 以 这 两 种 情况 并 不 是 互 斥 的 。 
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法 的 红 - 黑 树 。 

第 1 一 15 行 的 while 循环 的 每 次 重复 之 初 ,维持 如 下 状态 。 

CD 结 点 < 是 红色 的 。 

(2) 车 ple ER ple ER EN, 

(3) 若 存在 对 红 - 黑 树 性 质 的 违背 , 则 至 多 有 一 个 违背 , 且 或 是 对 性 质 2 的 违背 ,或 是 对 
性 质 4 的 违背 。 若 违背 了 性 质 2 , 那 是 因为 > 为 根 且 其 为 红色 的 。 若 违背 了 性 质 4, 那 是 因 
为 x 和 p[Lzj 都 是 红色 的 。 

由 于 此 while 循环 的 条 件 是 = 和 p[xj] 是 红色 的 ,所 以 pLp[xj]] 必 存在 。 根据 p[xj 是 
p[p[x]] 的 左 孩 子 还 是 右 孩 子 需 要 考虑 6 种 情形 ,不 过 其 中 的 3 种 情形 与 另外 3 种 是 对 称 
的 ,这 在 第 2 行 加 以 确认 。 仅 给 出 了 ple pLp[xj] 的 左 孩子 情形 的 代码 ,对 称 的 部 分 代 
码 读者 可 自行 添加 。 

情形 1: z AAA y(=right| pL plz] | D ZAE RS 

图 2-24 展示 了 情形 1 的 状态 。 当 ple] Al y 都 是 红色 的 时 候 , 构 成 情形 1。 由 于 
p[Lp[xj] 是 黑色 的 ,可 以 把 ple) Al y 都 着 成 黑色 (第 5.6 行 ), 以 此 来 修正 z Al pz ABET 
色 的 问题 ,上 且 将 pLp[zj] 着 成 红色 (第 7 行 ), 以 此 保持 了 性 质 5。 然 后 将 pLp[x]] 作 为 新 的 
结 点 =( 第 8 行 ) 重 复 此 while 循环 。 这 样 就 在 树 中 上 升 了 两 层 。 

图 2-24 显示 了 过 程 RB-INSERT 的 情形 1。 由 于 = 及 其 父亲 p[z] 都 是 红色 的 ,违背 了 
性 质 4。 无 论 图 2-24(a) 中 = 是 右 孩 子 还 是 图 2-24(b) 中 < 是 左 孩子 ,都 将 做 一 个 动作 。 每 
一 棵 子 树 a B.y.0 File 都 有 一 个 黑色 的 根 , 而 求 具有 相同 的 黑色 高 度 。 对 情形 1 的 代码 变 
换 了 某 些 结 点 的 颜色 ,并 保持 性 质 5: 所 有 从 一 个 定点 起 向 下 到 叶子 的 路 径 都 有 相同 数量 的 
黑色 结 点 。 该 while 循环 将 以 x 的 祖父 p[p[x]] 作 为 新 的 < 而 继续 。 现 在 对 性 质 4 nob 
只 可 能 发 生 在 新 的 > 是 红色 的 且 其 父亲 也 是 红色 的 。 


图 2-24 过程 RB-INSERT 的 情形 1 


情形 2: z 的 叔叔 是 黑色 的 且 z 是 一 个 右 孩 子 

第 10 行 和 第 11 行 构成 情形 2, 它 在 图 2-25 中 与 情形 3 一 起 展示 。 在 情形 2 中 , 结 点 
是 其 父亲 的 右 孩 子 。 立 即 利 用 一 次 左旋 转 将 其 转换 成 情形 3 ,在 此 情形 中 = 是 一 个 左 孩 子 。 
由 于 = 和 户 [>] 都 是 红色 的 ,该 旋转 既 不 会 影响 各 结 点 的 黑色 高 度 , 也 不 会 违背 性 质 5。 
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情形 3: z 的 叔叔 是 黑色 的 且 z 是 一 个 左 孩 子 

无 论 是 直接 进入 情形 3 还 是 通过 情形 2 进入 情形 3,z 的 叔叔 y 是 黑色 的 ,否则 将 执行 情 
JÉ 1。 再 则 , 结 点 pLp[z]] 存 在 ,因为 上 文 已 经 论证 过 执行 了 第 2 行 和 第 3 行 此 结 点 就 存在 了 ， 
并 在 第 10 行将 > 上 移 一 层 然后 在 第 11 行 再 下 移 一 层 ,p[Lp[Lzj]] 的 身份 没有 改变 。 在 情形 3 中 
(第 12 一 14 行 ) ,执行 若干 颜色 改变 和 一 次 右 旋转 ,将 保持 性 质 5, 然 后 ,由 于 不 再 有 两 个 红色 结 
点 连 在 一 起 ,我 们 就 完成 了 任务 。 该 while 循环 不 再 执行 ,因为 p[x] 此 时 已 为 黑色 。 

当 循 环 终止 时 ,p[z] 是 黑色 的 (车 < 是 根 , 则 p[xj 是 哨兵 mil[Tj, 它 是 黑色 的 ), 所 以 循 
环 终止 时 没有 对 性 质 4 的 违背 。 只 可 能 有 对 性 质 2 的 违背 。 第 16 行 恢复 了 此 性 质 ,所 以 当 
RB-INSERT-FIXUP 终止 时 ,所 有 的 红 - 黑 树 性 质 都 成 立 。 

图 2-25 所 示 为 过 程 RB-INSERT 的 情形 2 和 情形 3。 就 像 在 情形 1 中 ,性质 4 在 情形 2 
或 情形 3 中 被 违背 ,因为 = 及 其 父亲 ple] EA NY, RE apy 和 6 都 有 一 个 黑色 
HJAR Ca B 和 7 是 根据 性 质 4, 而 6 是 因为 车 否则 为 情形 1) ,以 及 每 一 棵 都 有 同样 的 黑色 高 
度 。 通 过 一 次 左旋 转 情形 2 可 转换 成 情形 3, 它 保持 了 性 质 5: 从 一 个 结 点 向 下 到 叶子 的 所 
有 路 径 都 有 相同 多 的 黑色 结 点 。 情 形 3 做 了 若干 个 颜色 变化 和 一 次 右 旋转 ,这 也 保持 了 性 
质 5。 该 while 循环 就 终止 ,因为 性 质 4 得 以 满足 : 不 再 有 两 个 红色 结 点 连 在 一 起 。 


情形 2 情形 3 
图 2-25 过 程 RB-INSERT 的 情形 2 和 情形 3 


RB-INSERT 的 运行 时 间 是 多 少 ? 由 于 一 棵 具有 nn 个 结 点 的 红 - 黑 树 的 高 度 是 O(lgn)， 
RB-INSERT 的 第 1 一 16 行 耗 时 Ogn). YE RB-INSERT-FIXUP 中 ,while 循环 只 有 在 情形 1 
被 执行 时 才 会 重复 ,上 且 指针 x 在 树 中 上 移 两 层 。 所 以 该 while 循环 至 多 能 别 执行 O(lgn) 次 。 
于 是 ,RB-INSERT 总 耗 时 O(lgz) 。 有 趣 的 是 旋转 至 多 被 执行 两 次 ,因为 若 执行 了 情形 2 或 
情形 3 ,该 while 循环 就 会 终止 。 


3. 删除 


和 其 他 对 具 及 个 结 点 的 红 - 黑 树 的 基本 操作 一 样 ,删除 一 个 结 点 耗 时 Ogn). M 
红 - 黑 树 中 删除 一 个 结 点 要 比 插入 一 个 结 点 稍稍 复杂 。 

过 程 RB-DELETE 是 对 TREE-DELETE 过 程 的 一 个 修改 。 删 除 结 点 后 ,调用 一 个 辅助 过 
程 RB-DELETE-FIXUP 修改 一 些 颜 色 并 执行 若干 旋转 以 恢复 红 - 黑 树 的 性 质 。 


RB-DELETE( T. z) 

1 if ZeftLz]—nil T] or right(z]=nil[T] 
2 then yz 

3 else y-- TREE-SUCCESSOR(z) 

4 if leftL y] nil T] 

5 then z-—Ileft[ y] 
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6  elez-righi y] 

7 pLx]-- ply] 

8 if ply]=nillT] 

9 then root[ T]<x 

10 else if y—1eft ply] 

11 then le ft( pL y]]-—7 

12 else right pLy]]<2« 
13 if yz 

14 then key[z]<keyLy] 

15 copy y's satellite data into z 
16 if color. y] BLACK and xil T] 
17 then RE-DELETE-FIXUP(T, x) 


18 return y 
算法 2-23 从 红 - 黑 树 T 中 删除 结 点 = 的 过 程 RB-DELETE 


TREE-DELETE 和 RB-DELETE 过 程 之 间 有 3 个 区 别 。 首 先 ,TREE-DELETE 中 所 有 对 
NIL 的 引用 在 RB-DELETE 中 都 蔡 换 为 对 哨兵 ni[Tj] 的 访问 。 其 次 ,TREE-DELETE 中 的 
第 7 行 对 zx 是 否 为 NIL 的 检测 被 删除 ,并 在 RB-DELETE 的 第 7 行 执 行 无 条 件 赋值 plr] 
p[y]。 于 是 ,车 zz 是 哨兵 nit[T], 其 父亲 指针 指向 被 删除 的 结 点 y。 最 后 ,车 y 是 黑色 的 ， 
在 第 16 行 和 第 17 行 调用 RB-DELETE-FIXUP。 若 y 是 红色 的 ,即使 y 被 删除 红 - 黑 树 性 质 
依然 成 立 , 原 因 如 下 。 

CD 树 中 的 黑色 高 度 没有 改变 。 

(2) 没有 相 邻 的 红色 结 点 。 

(3) 由 于 车 y 是 红色 的 它 就 不 是 根 , 根 仍然 是 黑色 的 。 

传递 给 RB-DELETE-FIXUP 的 结 点 x 是 两 种 结 点 之 一 : 或 者 是 在 y 未 被 删除 前 y 不 是 
哨兵 nil[ 了 的 唯一 的 孩子 ,或 y 没 有 孩子 ,zx 是 哨兵 nil[T]。 在 后 面 的 情形 中 ,第 7 行 的 无 条 
件 赋 值 保证 了 z 的 父亲 现在 是 y 的 原来 的 父亲 ,不 管 z 是 有 关键 值 的 内 结 点 还 是 哨兵 nil T]. 
并 且 无 论 y 的 颜色 如 何 删 除 y 都 不 会 破坏 红 - 黑 树 的 任何 性 质 。 而 对 于 后 者 , 当 y 为 黑色 结 
点 时 需要 调用 过 程 RB-DELETE-FIXUP 调整 树 T 的 结构 ,恢复 可 能 被 破坏 的 红 - 黑 树 性 
质 了 。 

现在 可 以 来 考察 过 程 RB-DELETE-FIXUP 是 如 何 恢复 红 - 黑 树 性 质 的 了 。 

RB-DELETE-FIXUPCT,z) 

1 while z 天 root[T] and color[.z] - BLACK 

2 doif x—left( p[ x1] 


3 then z-—right[ p[ x1] 

4 if color[ w] — RED 

S then color[w]<-BLACK 上 情形 1 
6 color[ p[ x ]]4 RED 上 情形 1 
7 LEFT-ROTATECT. p[ x) DE 1 
8 w--right[ pLx]] DHE 1 
9 if color( left[w]]— BLACK and color[ right[w]]— BLACK 
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10 then color[ :w]*- RED DE 
11 zx-—p[x] 上 > 情形 2 
12 else if color[ right[:w]]— BLACK 

13 then color(left[ w]]--BLACK 上 情形 3 
14 colorLw]--RED 上 情形 3 
15 RIGHT-ROTATE(T,w) 上 情形 3 
16 w--right[ pLx]1] 上 > 情形 3 
17 color[ w]<colorl pLx 1] 上 > 情形 4 
18 color[ pla] ]*-BLACK DATE 4 
19 color[ right[:w] ]--BLACK DAE 4 
20 LEFT-ROTATE(T, p[ x]) DE 
21 x--root( T] DAE 4 
22 else (same as then clause with "right"and "left" exchanged) 


23 color. x ]-- BLACK 
算法 2-24 删除 结 点 后 恢复 红 - 黑 树 性 质 的 过 程 RB-DELETE-FIXUP 


若 RB-DELETE 删除 的 结 点 y 是 黑色 的 ,就 会 发 生 3 个 问题 。 首 先 , 若 y 是 根 且 y 的 一 
个 红色 的 孩子 成 为 新 的 根 ,就 违背 了 性 质 2。 其 次 ,车 z 和 p[y]( 现 在 它 也 是 p[z]) 是 红色 
的 ,这 违背 了 性 质 4。 再 次 ,y 的 删除 造成 原先 任 一 包含 y 的 路 径 都 少 了 一 个 黑色 结 点 。 这 
样 树 中 任 一 y 的 前 辈 都 将 违背 性 质 5。 可 以 通过 声称 x 有 一 份 “ 额 外 的 ”黑色 来 纠正 此 问 
题 , 即 若 对 任 一 含有 z 的 路 径 都 为 所 含 黑色 结 点 数 加 1, 则 在 此 解释 下 ,性 质 5 成 立 。 当 删 
掉 y 后 ,将 其 "黑色 ”性质 * 推 ?给 它 的 孩子 。 现 在 的 问题 是 zx 既 非 红色 又 非 黑色 ,所 以 违背 
了 性 质 1。 现 在 的 做 法 是 ,z 或 为 " 双 黑 ?或 为 " 红 - 黑 ”上 且 分 别 对 包含 x 的 路 径 所 含 黑色 结 点 
数 贡献 2 或 1。z 的 color 属性 仍然 或 是 RED( 若 x 为 “ 红 - 黑 ”) 或 是 BLACK( 若 x 为 “ 双 
黑 ”) 。 换 句 话 说 , 结 点 额外 的 黑色 反映 在 zx 的 指针 上 而 非 color 属性 上 。 

过 程 RB-DELETE-FIXUP 将 恢复 性 质 1.2 和 4。 第 1 一 22 行 的 while 循环 的 目标 是 将 树 
中 额外 黑色 向 上 移动 直至 如 下 。 

CD z 指向 一 个 红 - 黑 结 点 ,在 此 情形 中 第 23 行将 x 着 成 (单一 ) 黑 色 。 

(2) x 指向 根 , 在 此 情形 中 可 以 将 额外 的 黑色 直接 “ 移 除 ”。 

(3) 可 以 执行 合适 的 旋转 和 重新 着 色 。 

图 2-26 所 示 为 过 程 RB-DELETE-FIXUP 的 while 循环 中 的 各 种 情形 。 黑 色 的 结 点 具有 
color 属性 BLACK , 深 阴影 结 点 具有 color 属性 RED, 浅 阴影 结 点 具有 color 属性 c 或 c' ,或 
RED H BLACK, FF a Boe g 表示 任意 子 树 。 在 每 种 情形 中 ,左边 的 格局 通过 改变 结 点 
的 颜色 或 /并 执行 一 次 旋转 转换 成 右边 的 格局 。 任 一 被 x 指向 的 结 点 有 一 份额 外 的 黑色 ， 
它 或 是 双 黑 色 或 是 红 -黑色 。 唯 一 能 使 该 循环 重复 的 是 情形 2。 图 2-26(a) 是 情形 1 通过 改 
变 结 点 BA D 的 颜色 并 执行 一 次 左旋 转 而 转换 成 情形 2、3 或 4。 图 2-26(b) 是 在 情形 2 中 ， 
由 zz 指针 表示 的 额外 黑色 通过 将 结 点 D 着 成 红色 并 将 x 指向 结 点 B 而 在 树 中 被 上 移 。 如 
果 是 从 情形 1 进入 情形 2 的 ,该 while 循环 将 终止 ,因为 新 的 结 点 z 是 红 -黑色 的 ,所 以 其 
color 属性 c 是 RED。 图 2-26(c) 是 情形 3 通过 改变 结 点 C 和 D 的 颜色 并 执行 一 次 右 旋转 
被 转换 成 情形 4。 图 2-26(d) 是 在 情形 4 中 .zx 表示 的 额外 黑色 可 以 通过 改变 一 些 结 点 的 颜 
色 并 执行 一 次 左旋 转 而 取消 (不 违背 红 - 黑 树 性 质 ) ,并 终止 循环 。 
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ee 


4 
新 x=rool[7] 


(d) 
2-26 ”过程 RB-DELETE-FIXUP 的 while 循环 中 的 各 种 情形 


在 该 while 循环 中 ,zx 总 是 指向 非 根 双 黑 结 点 。 在 第 2 行 确认 xz 是 其 父亲 pLzj 的 左 孩 
子 还 是 右 孩 子 ( 已 经 给 出 了 xz 是 左 孩 子 情形 下 的 代码 ;zx 是 右 孩 子 的 情形 在 第 22 行 是 对 称 
的 )。 我 们 用 一 个 指针 ww 指向 z 的 兄弟 。 由 于 结 点 x 是 双 黑 的 , 结 点 ww 不 可 能 是 nil[TT]; 
否则 的 话 , 从 p[zj 到 ( 纯 黑色 的 ) 叶 子 w 的 路 径 所 含 黑色 结 点 数 将 小 于 从 2[z] 到 的 路 径 
上 的 黑色 结 点 数 。 

代码 中 的 4 种 情况 ?示例 于 图 2-26。 详 细 地 检测 每 一 种 情形 前 , 先 一般 地 观察 一 下 如 
何 验证 每 一 种 情形 所 做 的 转换 能 保持 性 质 5。 关 键 思 想 是 在 每 种 情形 中 ,从 子 树 的 根 ( 且 包 
含 ) 起 到 每 一 棵 子 树 a.B8、…、& 的 黑色 结 点 数 通 过 转换 保持 不 变 。 于 是 , 若 转换 前 性 质 5 成 
立 , 以 后 将 继续 成 立 。 例 如 ,在 图 2-26(a) 中 ,示例 了 情形 1, 从 根 起 到 子 树 或 8 的 黑色 结 点 
都 是 3 ,无 论 是 转换 前 还 是 转换 后 (再 次 提醒 ,z 附加 了 一 份额 外 黑色 ) 。 同 样 地 , 根 到 y、9、 
e Ag 的 黑色 结 点 数 转换 前 后 也 都 是 2。 在 图 2-26(b) 中 ,计数 要 包括 子 树 根 的 color 属性 的 
值 c, 它 可 能 是 RED 或 BLACK。 若 定义 count RED) —0 及 count BLACK) — 1, JU] MAR 59] 
o 的 黑色 结 点 数 是 2 十 count(c) ,无 论 是 转换 前 还 是 转换 后 。 在 此 情形 中 ,转换 后 ,新 的 结 点 
工具 有 color 属性 c ,但 此 结 点 真正 是 红 - 黑 ( 若 c= RED) UR G c 二 BLACK)。 其 他 情形 
可 以 相仿 地 进行 验证 。 


© 如 在 RB-INSERT-FIXUP 中 那样 ,RB-INSERT-FIXUP 中 的 几 个 情形 也 不 是 互 斥 的 。 
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情形 1: x 的 兄弟 w 是 红色 的 

情形 1CRB-DELETE-FIXUP 的 第 5 一 8 行 及 图 2-26(a) ) 发 生 在 结 点 xz 的 兄弟 结 点 ww 是 
红色 时 。 由 于 w 必 有 黑色 的 孩子 ,可 以 切换 vo 与 户 [z] 的 颜色 并 对 p[x] 做 一 次 左旋 转 而 不 
违背 任何 红 - 黑 树 性 质 。z 的 新 的 兄弟 ,是 旋转 前 w 的 孩子 ,现在 是 黑色 的 ,于 是 已 经 将 情 
JÉ 1 转换 成 了 情形 2,3 R 4. 

情形 2、3 及 4 发 生 于 ww 是 黑色 的 时 ,它们 与 情形 1 的 区 别 就 在 于 w 的 颜色 。 

情形 2: x 的 兄弟 w 是 黑色 的 , 且 w 的 孩子 都 是 黑色 的 

在 情形 2 中 (RB-DELETE-FIXUP 的 第 10 行 和 第 11 行 及 图 2-26(b)) «e 的 两 个 孩子 都 
是 黑色 的 。 由 于 w 也 是 黑色 的 ,从 x 和 ww 去 掉 一 重 黑色 ,使 得 DU IR Gili w 仅 为 红色 ， 
为 补偿 从 z+ 和 ww 中 去 除 的 黑色 ,把 额外 的 黑色 加 到 pac] E: , 它 原 来 可 能 是 红色 的 也 可 能 是 
黑色 的 。 通 过 将 plo EARN x EA while 循环 做 到 这 一 点 。 注 意 ,车 从 情形 1 进入 到 情 
形 2, 新 的 zx 是 红 - 黑 色 的 ,这 是 因为 p[z] 原 来 是 红色 的 。 所 以 ,新 的 zx 结 点 的 color 属性 < 
是 RED, 当 循环 检测 其 循环 条 件 时 将 终止 。 新 的 z 结 点 在 第 23 行 被 着 成 黑色 。 

情形 3: x 的 兄弟 w 是 黑色 的 ,w 的 左 孩 子 是 红色 的 ,而 w 的 右 孩 子 是 黑色 的 

情形 3( 第 13 一 16 行 及 图 2-26(c)) 发 生 在 w 是 黑色 的 时 ,其 左 孩 子 是 红色 的 而 其 右 孩 
子 是 黑色 的 时 。 可 以 切换 w 与 其 左 孩子 left[w] 的 颜色 然后 对 ww 执行 一 次 右 旋 转 而 不 违 
背 任何 红 - 黑 树 性 质 。z 新 的 兄弟 ww 现在 是 具有 红色 右 孩 子 的 黑 结 点 ,于 是 已 经 把 情形 3 转 
换 成 了 情形 4。 

情形 4: x 的 兄弟 w 是 黑色 的 ,而 w 的 右 孩 子 是 红色 的 

情形 4( 第 17 一 21 FRA 2-26(d) ) 发 生 在 x 的 兄弟 zw 是 黑色 的 且 w 的 右 孩 子 是 红色 
时 。 通 过 做 一 些 结 点 的 颜色 变化 并 对 pz] 执行 一 次 左旋 转 ,可 以 去 除 zx 上 的 额外 黑色 ,使 
它 具 有 纯 黑 色 ,而 不 违背 任何 红 - 黑 树 性 质 。 设 置 zx 为 根 , 使 得 while 循环 在 检测 其 循环 条 
件 时 终止 。 

RB-DELETE 的 运行 时 间 如 何 ? 由 于 具有 个 结 点 的 红 - 黑 树 的 高 度 是 O(lgz) ,过 程 中 
不 调用 RB-DELETE-FIXUP 的 部 分 耗 时 为 O(lgn)。 在 RB-DELETE-FIXUP 中 ,情形 1.3 和 4 
执行 了 常数 量 的 颜色 变换 及 至 多 3 次 旋转 。 情 形 2 是 仅 有 的 让 while 循环 可 能 重复 的 情 
形 。 并 且 指 针 x 在 树 中 至 多 上 移 O(lgz) 次 且 不 执行 旋转 操作 。 于 是 ,过 程 RB-DELETE- 
Fixup 耗 时 O(gn) 并 至 多 执行 了 3 次 旋转 ,RB-DELETE 的 总 运行 时 间 因 此 为 OU gn) 。 


2.4.7. 红 - 黑 树 的 程序 实现 


1. 数据 类 型 定义 

在 C 语 言 中 ,把 结 点 类 型 及 红 - 黑 树 类 型 定义 成 如 下 的 结构 体 。 

1 typedef enum (RED. BLACK) Color; / * 结 点 颜色 类 型 * / 

2 typedef struct node{ /x 二叉树 结 点 类 型 */ 
3 struct node * p; / * 父 结 点 指针 * / 

4 struct node * left; | * Ic ECT AS ARE / 
5 struct node * right; /=< 右 孩子 结 点 指针 * / 
6 Color color; 
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7 void * key; /* 数据 域 指针 */ 
8 }RBNode; 

9 RBNode * creatRBNode(void * key,int size) ; /创建 结 点 */ 

10 void clrRBNode(RBNode * r,void( * proc) (void * )); /* 清理 结 点 */ 

11 typedef struct{ /* 红 - 黑 树 类 型 * / 


12 unsigned nodeSize; 
13 int ( * comp) (void * ,void * ); 


14 RBNode * root; /* 根 结 点 指针 */ 
15 . RBNode * nil; / * 哨兵 结 点 指针 * / 
16 }RBTree; 

17 RBTree* creatRBTree(int size,int( * comp) (void * ,void * )); /* 创建 空 树 * / 
18 void clrRBTree(RBTree * t,void( * proc) (void * )) ; /* 清理 二 叉 树 * / 
19 void inorderRBWalk(RBTree * t,void ( * proc) (void * )) ; /* 中 序 遍历 * / 
20 RBNode * rbMini(RBTree * 0; /* 最 小 值 */ 

21 RBNode * rbMax(RBTree * t); /* 最 大 值 */ 

22 RBNode * rbSearch(RBTree* t,void* k); /* 查 找 */ 

23 void rbInsert(RBTree * t,void * key); /* TA */ 

24 RBNode * rbDelete(RBTree * t,RBNode * x); /< 删除 * / 


程序 2-22 定义 通用 红 - 黑 树 类 型 及 声明 操作 函数 的 头 文件 redblacktree. h 


对 程序 2-22 的 说 明 如 下 。 

(1) 第 2 一 8 行 的 结构 体 类 型 RBNode 定义 的 是 红 - 黑 树 结 点 。 与 简单 的 二 叉 树 结 点 类 
型 BTreeNode 相 比 , 增 加 了 一 个 表示 结 点 颜色 的 属性 color, 该 属性 定义 成 第 1 行 的 枚 举 类 
型 Color。 由 于 将 数据 域 key 定义 成 void * ,可 以 指向 存储 任何 类 型 的 内 存单 元 ,所 以 是 通 
用 的 数据 结构 。 第 9 行 和 第 10 行 声 明 的 函数 creatRBNode、clrRBNode, 分 别 用 来 创建 结 
点 、 清 理 结 点 空间 。 

(2) 第 11—16 行 的 结构 体 类 型 RBTree 定义 的 是 红 - 黑 树 。 它 有 4 个 属性 : 结 点 数据 
域 的 存储 宽度 nodeSize、 结 点 数据 比较 规则 comp、 根 结 点 指针 root 和 哨兵 结 点 指针 nil。 第 
17 行 和 第 18 行 声明 的 函数 creatRBTree 和 clrRBTree 是 用 来 创建 空 红 - 黑 树 和 清理 红 - 黑 
树 空间 的 。 第 19 行 声明 的 函数 inorderRBWalk 用 来 对 红 - 黑 树 进行 中 序 遍历 。 

(3) 第 20 行 和 第 21 行 声 明 的 函数 rbMini 和 rbMax 分 别 计算 红 - 黑 树 中 关键 值 最 小 / 
最 大 的 结 点 。 第 22 行 声 明 的 函数 rbSearch 实现 算法 2-14 中 的 过 程 TREE-SEARCH, 这 是 
因为 红 - 黑 树 本 质 上 就 是 一 棵 二 又 搜索 树 。 第 23 行 和 第 24 行 声 明 的 函数 rbInsert 和 
rbDelete 分 别 实现 算法 2-21 的 RB-INSERT 过 程 和 算法 2-23 的 RB-DELETE 过 程 。 

下 面 来 分 别 定义 上 述 函 数 。 


2. 结 点 维护 


二 叉 树 是 由 结 点 根据 父子 关系 连接 起 来 构成 的 。 结 点 是 二 又 树 的 “基础 设施 ”。 需 要 对 
基础 设施 进行 常规 的 维护 ,包括 创建 结 点 和 清理 不 再 使 用 的 结 点 的 存储 空间 。 


1 RBNode * creatRBNode(void * key,int size) ( /* 创 建 结 点 * / 
2 RBNode * x 一 (RBNode* ) malloc(sizeof (RBNode)) ; 
3 x-»key- (void * ) malloc(size) ; 
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4 memepy(x->key, key, size) ; 

5 x->p=x->left=x->right= &nil; 
6 x-»color— RED; 

rd return x; 

8) 

9 void clrRBNode(RBNode * r,void( * proc) (void * )) ( /*#* 清 理 二 叉 树 结 点 * / 
10 r-»p-—r-»left— r-»right- NULL; 
11 if(proc) 

12 proc(r->key) ; 

13 free(r—>key) ; 

14 } 


程序 2-23 ”对 红 - 黑 树 结 点 进行 维护 的 C 函数 
由 于 红 - 黑 树 本 质 上 就 是 二 叉 树 ,所 以 其 结 点 仅 比 二 叉 树 结 


点 多 一 个 表示 颜色 的 属性 


color。 相 应 地 ,对 结 点 的 维护 操作 中 ,创建 结 点 时 需要 设置 颜色 值 ,默认 情况 下 , 设 为 红色 
(RED)。 其 他 的 维护 操作 与 对 普通 二 又 树 结 点 的 完全 一 致 。 
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3. 红 - 黑 树 常 规 维护 


对 红 - 黑 树 的 常规 维护 操作 包括 创建 红 - 黑 树 、 清 理 不 再 使 用 的 红 - 黑 树 的 存储 空间 以 及 
对 红 - 黑 树 的 遍历 。 


1 static RBNode nil= (NULL, NULL, NULL, BLACK, NULL) ; 

2 RBTree * creatRBTree(int size,int( * comp) (void * ,void * )) | 
8 RBTree * t— CRBTree * ) malloc(sizeof RBTree)) ; 

4 t->nodeSize= sizes 

5 t->comp= comp; 

6 — t->nil= &nil; 

7 t->root=t->nils 

8 return t; 

9} 

10 static void clrTree(RBNode * r.void( * proc) (void * )) { 
11 if(r= = &niD 


12 return; 

13 if (r->left != &nil) 

14 clrTree(r->left, proc) ; 
15 if (r->right != &niD 

16 clrTree(r->right, proc) ; 


17 clrRBNode(r. proc) ; 
18 free(r); 


19 } 

20 void clrRBTree(RBTree * t.void( * proc) (void * )){ 
21 clrTree(t—>root, proc) ; 

22] 


/# 哨兵 结 点 * / 

/ * 创建 空 红 - 黑 树 * / 

/* 分 配 空间 * / 

/* 设 置 结 点 数据 存储 宽度 * / 
/* 设 置 结 点 数据 比较 规则 * / 
/ * 设置 哨兵 结 点 * / 

/* 将 树 置 空 * / 


/* 清理 二 叉 树 * / 


/* 清理 左 子 树 * / 


/* 清理 右 子 树 * / 


/* 清理 本 结 点 * / 


23 static void inorder(RBNode * r,void( * proc) (void * )) { /x* 对 以 r 为 根 的 二 叉 树 中 序 遍 历 */ 


24 if(r->left!= &nil) 


/ * 遍历 左 子 树 / 
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25 inorder( r-»left. proc) ; 

26 proc([r-»key) ; /* 处 理 根 结 点 数据 * / 

27 — if(r->right! = &-nil) /* 遍历 右 子 树 */ 

28 inorder(r—>right, proc) ; 

29 } 

30 void inorderRBWalk(RBTree * t.void ( * proc (void * )) {  / * 对 红 - 黑 树 进行 中 序 遍 历 * / 
31 if(t-»root— =t->nil) 

32 return; 

33 inorder(t->root, proc); 

34 } 


FF 2-24 AR HUE IP PRÉC 


对 程序 2-24 的 说 明 如 下 。 

CD 为 节省 存储 空间 ,第 1 行 定义 一 个 全 局 量 一 一 哑 结 点 nil。 它 作为 任何 一 棵 红 - 黑 树 
的 哨兵 结 点 。 根 据 哨 兵 结 点 的 特性 ,nil 的 所 有 指针 域 包 括 父 指针 、 孩 子 指针 及 关键 值 指针 
均 指 向 空 (NULL), 颜 色 域 置 为 黑色 (BLACK)。 利 用 此 全 局 哑 结 点 nil, 第 2 一 9 行 的 
creat RBTree 函数 对 创建 的 红 - 黑 树 设置 其 哨兵 结 点 ,并 用 传递 给 它 的 参数 size 和 comp i 
置 红 - 黑 树 结 点 数据 存储 宽度 和 结 点 数据 比较 规则 。 

(2) 由 于 将 红 - 黑 树 定义 成 由 根 结 点 指引 并 具有 哨兵 结 点 、 结 点 存储 宽度 、 结 点 数据 比 
较 规则 的 结构 体 ,与 将 树 仅 视 为 结 点 的 父子 链接 不 同 , 不 能 直接 对 指向 一 棵 红 - 黑 树 的 指针 
运用 递归 操作 。 所 以 ,第 20 一 22 行 定义 的 清理 参数 t 指定 的 红 - 黑 树 存储 空间 的 函数 
clrRBTree, 需 要 调用 第 10 一 19 行 定义 的 清理 参数 r 指定 的 结 点 作为 根 的 二 又 树 空间 的 递 
归 函 数 clrTree。 细 心 的 读者 也 许 已 经 看 出 来 ,函数 clrTree 的 操作 与 程序 2-20 定义 的 二 叉 
树 空间 清理 函数 clrBTree 是 一 样 的 。 有 一 点 不 同 的 是 clrTree 定义 成 static 函数 ,这样 就 将 
其 可 用 范围 局 限 在 本 文件 中 ,作为 clrRBTree 调用 的 功能 函数 而 对 外 部 加 以 屏蔽 。 

(3) 与 (2) 中 对 参数 类 型 所 决定 的 函数 clrRBTree 与 clrTree 定义 方式 的 变化 一 样 的 理 
由 ,第 30 一 34 行 定义 的 对 由 参数 t 指定 的 红 - 黑 树 做 中 序 遍 历 操 作 的 函数 需 调 用 第 23 一 29 
行 定义 的 对 由 参数 指定 的 结 点 为 根 的 二 又 树 做 中 序 遍 历 的 递归 函数 inorder。inorder 也 
是 static 函数 。 


4. 红 - 黑 树 的 查询 操作 函数 


对 红 - 黑 树 的 查询 操作 包括 在 其 中 查找 指定 关键 值 结 点 、 计 算 树 中 最 小 /最 大 关键 值 结 


1 RBNode* rbSearch(RBTree * t,void * k){ 
2 int contrast; 

3 RBNode * r—t-»root; 

4 while(r! —t-»nil&-&-(contrast— t-»comp(r-»key, k))) { 
5 if(contrast>0) 

6 r— r-»left; 

7 else 

8 


r—r-»rights 
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9 ) 

10 if(r==t->nil) 

11 return &nil; 

12 return r; 

13 } 

14 static RBNode * treeMini(RBNode * r){ /* 求 最 小 值 结 点 * / 

15  while(r->left! = &nil) /* 找到 左 子 树 中 最 左边 的 结 点 * / 
16 r— r-»left; 

17 return r; 

18 } 


19 RBNode * rbMini(RBTree * O( 
20 if(t-»root— —t-»niD 


21 return NULL; 

22 return treeMini(t-»root) ; 

23 } 

24 static RBNode * treeMax(RBNode * r){ /* 求 最 大 值 结 点 * / 

25 while(r->right! = &-nil) /* 找到 右 子 树 中 最 右边 的 结 点 * / 
26 r—r-»right; 

27 return r; 

28 } 


29 RBNode * rbMax(RBTree * t){ 
30 if(t-»root— =t->nil) 


31 return NULL; 
32 return treeMax(t-» root) ; 
33 } 


程序 2-25 ” 红 - 黑 树 查询 操作 函数 的 定义 


对 程序 2-25 的 说 明 如 下 。 

(1) 第 1 一 13 行 定义 的 函数 rbSearch 实际 上 实现 的 是 算法 2-14 的 关于 二 又 搜索 树 的 查 
找 过 程 TREE-SEARCH。 虽 然 参数 改 成 了 红 - 黑 树 t, 但 在 函数 内 部 查找 起 点 是 从 t 的 根 结 点 
开始 的 。 这 是 因为 , 红 - 黑 树 本 质 上 就 是 一 棵 二 又 搜索 树 。 程 序 代码 与 算法 的 伪 代 码 结构 非 
常 接近 ,读者 可 对 照 研读 。 

(2) 第 19 一 23 行 定 义 的 函数 rbMini 计算 并 返回 红 - 黑 树 t 中 关键 值 最 小 的 结 点 。 由 于 
对 参数 传递 进来 的 红 - 黑 树 t 不 便 递归 ,所 以 调用 第 14 一 18 行 定 义 的 函数 treeMini, Mt 的 
根 结 点 起 递归 地 进行 计算 。 函 数 treeMini 实现 的 是 算法 2-15 的 TREE-MINIMUM 过 程 , 代 
码 几 乎 一 致 。 将 treeMini 定义 成 static 函数 的 目的 是 向 外 界 屏蔽 该 函数 。 

(3) 与 (2) 相 似 , 第 29~33 行 定义 的 函数 rbMax 计算 并 返回 红 - 黑 树 c 中 关键 值 最 大 的 
结 点 。 该 函数 调用 第 24 一 28 行 定义 的 实现 算法 2-16 的 TREE-MAXIMUM 过 程 的 递归 函数 
treeMax。 注 意 ,treeMax 也 是 一 个 static 函数 。 


5. 红 - 黑 树 的 旋转 


红 - 黑 树 的 旋转 操作 是 保持 红 - 黑 树 性 质 进而 维护 红 - 黑 树 平衡 的 基本 操作 。 旋 转 操作 包 
括 左旋 转 和 右 旋转 。 
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1 static void leftRotate(RBTree * t,RBNode * x){ /* 树 t+ 中 以 结 点 x 为 轴 左 旋转 * / 
2 RBNode * y— x-»right; /* BB y*/ 

3 x-»right— y-»left; /< 将 了 的 左 子 树 设置 为 x 的 右 子 树 * / 
4 y->left->p=x; 

5 y->p 一 x->p; /* 将 x 链接 到 y 的 父 结 点 */ 

6 if(x-»p— —t-»niD 

7 t-»root— y; 

8 else if(x= — x-»p-»left) 

9 x-»p-»left— y: 

10 else 

11 x-»p-»right— y; 

12 y->left=x; /* 将 x 置 为 y 的 左 孩 子 */ 

13 x->p=y; 

14 } 

15 static void rightRotate(RBTree * t, RBNode * x){ 

16 RBNode * y— x-»left; /* 设 置 y*/ 

17 x->left=y->right; /* 将 y 的 右 子 树 设置 为 x 的 左 子 树 */ 
18 y-»right-»p— x; 

19 y->p=x->p; /* 将 x 链接 到 y 的 父 结 点 */ 

20 if(x->p==t->nil) 

21 t-»root—y; 

22 else if( x— —x-»p-»right) 

23 x-»p-»right— y; 

24 else 

25 x-»p-»left— y; 

26 y->right= x; /*4 x BH y MAF */ 

27 x->p=ys 

28 } 


程序 2-26 ”实现 红 - 黑 树 旋转 操作 的 C 函数 


对 程序 2-26 的 说 明 如 下 。 

CD 第 1 一 14 行 定义 的 函数 leftRotate 实现 算法 2-20 的 LEFT-ROTATE 过 程 。 在 红 - 黑 
BY t 中 绕 结 点 x 做 左旋 转 。 该 函数 无 论 是 参数 还 是 代码 结构 都 几乎 是 算法 伪 代 码 过 程 的 翻 
版 ,两 者 仅 有 对 对 象 的 属性 表示 方式 有 所 不 同 。 读 者 可 对 照 研读 。 

(2) 第 15 一 28 行 定义 的 函数 rightRotate 在 红 - 黑 树 t 中 绕 结 点 x 做 右 旋转 。 其 代码 与 
leftRotate 的 代码 是 对 称 的 , 即 所 操作 的 结 点 的 左右 孩子 互 换 。 读 者 也 可 对 照 研 读 。 

(3) 函数 leftRotate 和 rightRotate 都 定义 成 static 函数 ,目的 就 是 要 向 外 界 屏 项 这 两 
个 函数 ,因为 它们 是 在 红 - 黑 树 中 插入 或 删除 结 点 的 操作 中 需要 调用 的 操作 步骤 , 仅 此 而 已 ， 
不 做 他 用 。 


6. 在 红 - 黑 树 中 插入 结 点 


利用 红 - 黑 树 的 旋转 操作 ,在 红 - 黑 树 中 进行 插入 结 点 ,可 保持 树 的 平衡 性 。 下 列 是 实现 
在 红 - 黑 树 中 插入 元 素 的 算法 2-21 和 算法 2-22 的 C 函数 。 
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1 static void insertFixup(RBTree * t, RBNode * z){ / * FG AWA * / 
2 RBNode * y; 

3 while(z—»p-»color— — RED) /< 只 要 z 和 z 的 父 结 点 均 为 红色 关 / 
4 if(z->p= =z->p->p->lefb { 

5 y72-»p-»p-»right; 

6 if(y->color= — RED) ( 

7 z-»p-»color— BLACK; 
8 y-»color— BLACK; 

9 z-»p-»p-»color— RED; 
10 z—z-»p-»ps 

11 jelse{ 

12 if(z= =z->p->right) { 
13 Z=2->p; 

14 leftRotate(t,z) ; 

15 ) 

16 z->p->color= BLACK; 
17 z-»p-»p-»color— RED; 
18 rightRotate(t.z-»p-»p) : 
19 } 

20 }else{ 

21 y=z->p->p->left; 

22 if(y->color= = RED) { 

23 z->p->color= BLACK; 
24 y->color= BLACK; 

25 z->p->p->color= RED; 
26 z=z->p->p; 

27 Jelset 

28 if(z= =z->p->left) { 

29 z—z-»p: 

30 rightRotate(t,z) ; 
31 } 

32 z->p->color= BLACK; 
33 z-»p-»p-»color— RED; 
34 leftRotate(t,z->p->p); 
35 } 

36 } 

37 t->root->color= BLACK; 

38] 


39 void rbInsertCRBTree * t,void * data) { 
40 int ( * comp) (void * ,void * ) — t-»comp; 


4l int size— t-»nodeSize; 

42 RBNode * x— t-»root, * y—t-»nil, * z— creatRBNode( data, size) ; 

43 — while(x! =t—>nil) { /* 确 定 z 的 父 结 点 * / 

44 y=x; /x*y 指 向 下 一 轮 x 的 父 结 点 */ 
45 证 (comp(z->key,x->key) 一 0) 
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46 x=x->left; 

47 else 

48 x= x-»right; 

49 ) 

50 — z-»p-y: /*z 是 y 的 孩子 */ 

51 if(y==t->nil) /*t 是 一 棵 空 树 */ 

52 t-»root—z; 

53 else if(comp(z-»key  y-»key) <0) /* 新 结 点 的 关键 值 小 于 父 结 点 的 关键 值 * / 
54 y->left=z; 

55 else 


56 y-»right—z; 

57 z-»left— t-»nil; 
58 z-»right— t-»nil; 
59 z-»color— RED; 
60 insertFixup(t,z) ; 
61) 


程序 2-27 实现 算法 2-21、 算 法 2-22 的 C 函数 定义 


对 程序 2-27 的 说 明 如 下 。 

CD 第 1 一 38 行 定义 的 函数 insertFixup 实现 算法 2-22 的 RB-INSERT-FIXUP 过 程 。 其 
中 ,第 4 一 20 行 的 让 语句 的 第 一 个 分 句 对 应 于 算法 2-22 的 第 2 一 15 行 的 证 语句 部 分 。 这 一 
部 分 的 代码 结构 十 分 接近 ,程序 中 第 21 一 38 行 的 else 分 句 部 分 是 与 前 一 部 分 对 称 的 代码 ， 
即将 前 者 中 的 left right 互 换 , 上 且 将 leftRotate 与 rightRotate 互 换 得 到 代码 。 

(2) 第 39 一 61 行 定 义 的 函数 rbInsert 实现 的 是 算法 2-21 的 RB-INSERT 过 程 。 与 算法 
过 程 稍 有 不 同 的 是 ,第 2 个 参数 传递 的 不 是 要 插入 的 结 点 z, 而 是 结 点 中 的 数据 data。 所 
以 ,在 函数 体内 的 第 42 行 用 data 作为 参数 调用 结 点 生成 函数 creatRBNode 创建 新 结 点 z。 
为 使 代码 表示 简洁 ,将 树 t 的 nodeSize 域 设置 为 变量 size, 而 将 t 的 比较 规则 设置 为 函数 指 
fF comp。 函 数 与 算法 的 代码 结构 十 分 接近 。 


7. 在 红 - 黑 树 中 删除 结 点 


和 在 红 - 黑 树 中 插入 结 点 相仿 ,在 红 - 黑 树 中 删除 结 点 也 需要 调用 树 的 旋转 操作 来 保持 
平衡 。 此 外 ,为 了 找到 删除 结 点 的 后 继 , 进 行 结 点 间 值 的 调整 还 需要 实现 算法 2-17 中 的 计 
算 二 又 搜索 树 中 指定 结 点 的 后 继 结 点 的 TREE -SUCCESSOR 过 程 。 


1 RBNode * treeSuccessor(RBNode * r){ /* 求 结 点 在 树 中 的 后 继 */ 

2 RBNode * y; 

3 if(r->right! = &-nil) /* 若 右 子 树 非 空 * / 

4 return treeMini(r—>right) ; / * 后 继 是 右 子 树 中 的 最 小 值 结 点 * / 
5 y=r->p; 

6 while( y! = &-nil& &-r= = y->right) {/**/ 

7 r=y; 

8 

9 


y=y->Ps 
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10 return y; 

11j 

12 static void deleteFixup(RBTree * t; RBNode * x){ 

13 RBNode * w; 

14 — while((x! =t->root) &.8-(x-»color— — BLACK)) 


15 if(x— =(x->p->left)) { 

16 w=x->p->right; 

17 if(w->color= — RED) { 

18 w->color= BLACK; 

19 x-»p-»color— RED; 

20 leftRotate(t, x-»p) ; 

21 w=x->p->right; 

22 } 

23 if( (w->left->color= = BLACK) &-& (w->right->color= = BLACK) ) { 
24 w->color= RED; 

25 x=x->p; 

26 }else{ 

27 if(w->right->color= = BLACK) { 
28 w->left->color= BLACK; 
29 w-»color— RED; 

30 rightRotate(t,w) ; 

31 w= x-»p-»right; 

32 ) 

33 w-»color— x-»p-»color; 

34 x-»p-»color— BLACK; 

35 if(w!=t->nil) 

36 w->right->color= BLACK; 
37 leftRotate(t. x-»p) : 

38 x—t-»root; 

39 ) 

40 Jelset 

41 w=x->p->left; 

42 if(w->color= = RED) { 

43 w->color= BLACK; 

44 x-»p-»color— RED; 

45 rightRotate(t, x-»p) ; 

46 w=x->p->left; 

47 } 

48 if(w->right->color= = BLACK®&. &.w->left->color= — BLACK) ( 
49 w->color= RED; 

50 X=X->p3 

51 Jelset 

52 if( w—>left->color= — BLACK) ( 
53 w-»right-»color— BLACK; 
54 w-»color— RED; 

55 leftRotate(t, w); 

56 w=x->p->left; 
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57 
58 
59 
60 
61 
62 
63 
64 
65 
66 
67 


) 

w-»color— x-»p-»color; 

x-»p-»color— BLACK; 

if(w!=t->nil) 
w->left->color= BLACK; 

rightRotate(t, x-»p) ; 

x=t->root; 


) 
x-»color— BLACK; 
) 


68 RBNode * rbDelete(RBTree * t, RBNode * z){ 


69 
70 
71 
72 
73 
74 
75 
76 
77 
78 
79 
80 
81 
82 
83 
84 
85 
86 
87 
88 
89 
90 } 


RBNode * y, * x; 
if(z->left= — t-»nil || z->right= =t->nil) 
yrz 
else 
y=treeSuccessor(z) ; 
if(y->left! =t—>nil) 
x=y->left; 
else 
x=y->right; 
X->p=y->p3 
if(y->p==t->nil) 
t->root= x; 
else if( y= =y->p->left) 
y->p->left=x; 
else 
y->p->right= x; 
if(y!=z) 
memcpy(z-»key: y-»key t->nodeSize) ; 
if(y->color= — BLACK8-8.x! =t->nil) 
deleteFixup(t, x); 
return y; 


BF 2-28 定义 实现 红 - 黑 树 结 点 删除 操作 的 C 函数 


对 程序 2-28 的 说 明 如 下 。 
CD 第 1 一 11 行 定义 的 函数 treeSuccessor 实现 算法 2-17 的 TREE-SUCCESSOR 过 程 , 计 
算 由 参数 了 指定 的 结 点 在 二 叉 搜索 树 中 的 后 继 结 点 。 代 码 结构 与 伪 代 码 相 同 , 不 再 袭 述 。 
它 仅 用 于 红 - 黑 树 删 除 操作 中 恢复 红 - 黑 树 性 质 时 需要 调用 。 
(2) 第 12 一 67 行 定 义 的 函数 deleteFixup 实现 算法 2-24 的 RB-DELETE-FIXUP 过 程 ， 
供 在 第 68 一 90 行 定义 的 函数 rbDelete 调用 ,删除 结 点 后 恢复 红 - 黑 树 性 质 。 其 中 ,第 15 一 
40 行 的 证 语句 的 第 一 个 分 句 对 应 算法 过 程 中 第 2 一 21 行 的 证 语句 部 分 。 第 40 一 65 行 的 
else 分 句 与 让 分 句 是 对 称 的 ,即将 前 者 中 的 left right 互 换 , 且 将 leftRotate 与 rightRotate 
互 换 得 到 代码 。 
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(3) 第 68 一 90 行 定 义 的 函数 rbDelete 实现 的 是 算法 2-21 的 RB-DELETE 过 程 。 程 序 
代码 与 伪 代 码 几 乎 一 一 对 应 。 

为 便于 代码 重用 ,将 程序 2-23 一 程序 2-28 的 代码 保存 为 文件 夹 datastructure 中 的 源 文 
件 redblacktree. c。 


2.4.8 二 又 搜 索 树 的 应 用 


二 叉 搜索 树 作为 表示 动态 集合 的 数据 结构 ,其 时 间 效 率 比 链表 好 。 下 列 是 用 红 - 黑 树 代 
蔡 链 表 解决 “数据 规范 ”问题 的 C 程序 。 为 节省 篇 幅 , 仅 列 出 对 整 型 数据 处 理 的 函数 。 


1 char * intProccess(char * s)í / % 整 型 数据 处 理 函 数 * / 

2 StrInputStream ssin; /* esiti AC / 

$ RBTree * T=creatRBTree(sizeof(int),intGreater); — / * AR} T 存 放 处 理 后 的 数据 / 
4 int x; 

5 initStrInputStream(&-ssin,s) + 

6 initStrOutputStream( & ssout, 250) ; 

7 while( ! sisEof( &ssin) ) { / * 处理 数 据 * / 

8 readInt( &ssin, &-x) ; 

9 ifCrbSearch T, 8.3) = =T->nil) /* 若 x 没 有 出 现在 树 工 中 * / 
10 rbInsertC T &-x); 


11 ) 

12 inorderRBWalk(T, putInt) ; 
13 clrRBTree(T, NULL) ; 

14 writeString(&-ssout,'\n") ; 


15 return ssout. begins 


程序 2-29 解决 “规范 数据 ”问题 的 程序 2-3 的 二 叉 搜索 树 版 本 normalizel.c 片段 


与 程序 2-9 相 比 , 第 9 行 和 第 10 行 的 证 语句 检测 到 当前 读 到 数据 项 x 未 在 处 理 过 的 数 
据 集合 T( 表 示 为 二 又 搜索 树 的 全 序 集 ) 中 出 现 过 ,直接 将 x 插 入 工 中 ,而 无 须 像 链表 那样 
先 找 到 插入 位 置 ,再 执行 插入 操作 就 能 得 到 有 序 结果 。 


2.5 散 列表 


2.5.1 直接 寻 址 表 与 散 列 表 


1. 直接 寻 址 表 


当 关 键 值 的 全 集 U 足够 小 时 直接 寻 址 是 一 项 简单 技术 。 假 定 某 应 用 需要 一 个 动态 集 
合 ,其 关键 值 取 自 全 集 U 二 {0,1,…,m 一 1) ,其 中 的 m 不 是 太 大 。 假 定 没有 两 个 元 素 具 有 相 
同 的 关键 值 。 
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利用 一 个 称 为 直接 寻 址 表 的 数组 T[0.. mm 一 1] 来 表示 该 动态 集合 ,其 中 的 每 一 个 元 素 
称 为 一 个 槽 位 ,对 应 于 全 集 U 中 的 一 个 关键 值 。 图 2-27 示例 了 该 方法 ; 槽 位 指向 集合 中 
关键 值 为 & 的 元 素 。 若 集合 中 不 包含 关键 值 为 & 的 元 素 , 则 TL[k] 二 NIL。 


key satellite data 


图 2-27 利用 直接 寻 址 表 T 3:3L— THERA 


图 2-27 显示 了 利用 直接 寻 址 表 工 实现 一 个 动态 集合 。 全 集 U 王 140,1,…',9} 中 的 每 一 
个 关键 值 对 应 表 中 的 一 个 下 标 。 实 际 关键 值 集合 人 三 {2,3,5,8} 确 定 了 表 中 含有 指向 各 元 
素 的 指针 的 槽 位 。 深 色 阴 影 的 其 他 槽 位 含有 NIL。 

对 直接 寻 址 表 工 实现 字典 操作 是 轻而易举 的 。 

DIRECT-ADDRESS-SEARCH( T£) 

return T [4] 

DIRECT-ADDRESS-INSERT( T x) 

Tlkeylax]]-x 

DIRECT-ADDRESS-DELETE( Tx) 

TLkey[z]]<-NIL 


算法 2-25 对 直接 寻 址 表 的 字典 操作 过 程 
每 一 个 操作 都 很 快 ,只 需 O(1) 时 间 。 
2. 散 列表 


直接 寻 址 的 困难 之 处 是 显而易见 的 : 若 全 集 U 很 大 时 .在 通常 的 计算 机 中 对 给 定 的 内 
存 容量 存储 规模 为 |U| 的 表 工 是 不 现实 的 ,甚至 是 不 可 能 的 。 此 外 ,实际 存储 的 关键 值 集 合 
K 可 能 相对 于 避 来 说 很 小 ,以 至 于 工 中 的 大 多 数 槽 位 会 被 浪费 。 

当 存储 在 字典 中 的 关键 值 集合 K 比 所 有 可 能 关键 值 的 全 集 U 小 得 多 时 ,一 个 散 列表 所 
需 的 空间 远 比 一 个 直接 寻 址 表 的 要 少 得 多 。 具 体 地 说 ,所 需 的 空间 可 以 节省 为 8(| 开 |) ,并 
且 在 散 列表 中 查找 一 个 元 素 仍 保持 O(1) 的 时 间 。 唯 一 需要 说 明 的 是 此 上 界 是 对 平均 时 间 
而 言 ,而 对 直接 寻 址 表 来 说 却 是 最 坏 情 形 时 间 的 上 界 。 

在 直接 寻 址 方法 中 ,一 个 关键 值 为 & 的 元 素 存储 在 槽 位 & 处 。 在 散 列 方法 中 ,此 元 素 存 
储 在 槽 位 (4) 中 ;也 就 是 说 ,使 用 一 个 散 列 函 数 h 根据 关键 值 x 计算 出 槽 位 。 此 处 的 天 把 
全 集 U 映射 到 散 列表 了 T[0..m 一 1] 的 槽 位 : 
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h:U — (0,1,,m— 1) 
图 2-28 显示 了 利用 散 列 函数 h 将 关键 值 映射 到 散 列表 的 槽 位 。 关 键 值 : 和 ks 映射 
到 相同 的 槽 位 ,所 以 它们 冲突 了 。 


图 2-28 ”利用 散 列 函数 h 将 关键 值 映射 到 散 列表 的 模 位 


我 们 说 具有 关键 值 的 元 素 散 列 到 槽 位 UO ,也 说 h(k) 是 关键 值 的 散 列 值 。 图 2-28 
示例 了 此 基本 思想 。 散 列 函 数 的 要 点 是 缩小 了 要 处 理 的 数组 下 标 范 围 。 不 是 |U | 个 值 而 只 
需 m 个 值 。 所 需 的 存储 空间 也 相应 地 减少 了 。 

在 创建 散 列 函 数 的 除法 散 列 法 中 ,通过 计算 k 除 以 m 的 余数 将 关键 值 ¢ 映射 到 m ARE 
位 中 的 一 个 , 即 散 列 函 数 为 

h(k) — k mod m 
BNA 25 BOA AEN AA m —12 且 k 二 100, 则 有 h(k) 二 4。 由 于 仅 需 要 做 一 次 除法 操作 ,用 除 
法 方法 进行 散 列 是 很 快 的 。 
这 样 做 存在 着 一 个 问题 : 两 个 关键 值 可 能 散 列 到 同一 个 槽 位 ,把 此 状况 称 为 一 个 冲突 。 


2.5.2 用 拉链 法 解决 冲突 


1. 拉链 法 散 列表 的 字典 操作 


在 拉链 法 中 ,把 所 有 散 列 到 同一 槽 位 中 的 元 素 放 到 一 个 链表 中 ,如 图 2-29 Bros, MEL j 
包含 一 个 指向 有 所 有 散 列 到 /的 元 素 构成 的 链表 的 指针 ; 若 没有 这 样 的 元 素 则 槽 位 j 包 
# NIL. 

图 2-29 所 示 为 利用 拉链 解决 冲突 。 散 列表 的 每 个 槽 位 TL 门 含有 一 个 由 所 有 散 列 到 7 
的 关键 值 组 成 的 链表 。 例 如 ,hk )==h(ks) Al h(ks) —h OS) — h O8). 

设 散 列 函 数 为 ,车 用 拉链 法 解决 冲突 ,对 一 个 散 列表 作 的 字典 操作 是 很 容易 实现 的 。 


CHAINED-HASH-SEARCH(T,k) DERIK T 中 查找 关键 值 为 A 的 元 素 
return LIST-SEARCHCT[AGO ].4) 
CHAINED-HASH-INSERT( T, x) DERIK T PRATE x 


1 if CHAINED-HASH-SEARCH( T ,key[x])=NIL 
2 then 调用 LIST-INSERT 将 z 插入 到 表 T[h(key[z])] 的 表 首 
CHAINED-HASH-DELETE(T,k) DERIK T 中 删除 关键 值 为 & 的 元 素 
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1 z<LIST-SEARCH (T[AGO ].4) 
2  LIST-DELETECT[A GO ]. a) 


算法 2-26 散 列表 的 查找 ,插入 与 删除 过 程 


+E 


J-A- 


AA 


图 2-29 利用 拉链 解决 冲突 


无 论 是 在 散 列表 中 插入 元 素 的 CHAINED-HASH-INSERT 过 程 , 还 是 从 散 列表 中 删除 元 
素 的 CHAINED-HASH-DELETE 过 程 , 都 需要 先 在 表 中 进行 一 次 查找 。 对 于 前 者 来 说 ,查找 
的 目的 是 确定 表 中 是 否 已 经 存在 与 指定 元 素 zx 的 关键 值 相 同 的 元 素 , 只 有 当 z 的 关键 值 未 
曾 出 现在 表 中 , 才 将 其 插入 到 表 中 ,以 此 保证 表 中 元 素 的 关键 值 两 两 不 同 。 而 对 于 后 者 来 
说 ,需要 确定 表 中 是 否 存 在 与 指定 关键 值 k 相等 的 元 素 ,然后 再 将 其 从 关键 值 对 应 的 槽 位 链 
表 中 删除 。 由 于 表 元 素 是 存储 在 槽 位 链表 中 的 ,所 以 在 过 程 CHAINED-HASH-DELETE 中 ， 
调用 的 是 链表 查找 过 程 , 它 返 回 的 是 链表 结 点 ,这 样 才能 正确 地 删除 元 素 。 


2. 用 拉链 法 的 散 列 技术 分 析 


用 拉链 法 的 散 列 技术 能 做 得 多 好 呢 ? 特别 地 ,用 一 个 给 定 的 关键 值 查找 元 素 要 花费 多 
长 时 间 呢 ? 

给 定 一 个 具有 m 个 槽 位 、 存 储 了 个 元 素 的 散 列表 本 ,定义 的 装载 因子 a H n/m, W 
一 个 拉链 表 中 的 平均 元 素数 目 。 我 们 的 分 析 将 用 a 来 表示 ,a 可 能 小 于 、 等 于 或 大 于 1。 

使 用 拉链 法 的 散 列 技术 在 最 坏 情 形 下 的 表现 是 很 糟糕 的 : 所 有 个 关键 值 都 散 列 到 同 
一 个 槽 位 ,构成 了 一 个 长 度 为 n 的 链表 。 最 坏 情形 下 的 查找 耗 时 O G0 DI E TESTER PR CIS 
时 间 一 一 并 不 比 就 使 用 一 个 链表 来 存储 所 有 元 素 更 好 。 显 然 , 散 列表 不 会 用 到 最 坏 情形 下 
的 性 能 。 

散 列 法 的 平均 性 能 取决 于 散 列 函数 h 如 何 将 关键 值 集合 均匀 地 映射 到 xm 个 存储 槽 位 。 
现在 假定 任 一 给 定 的 元 素 是 等 概 地 散 列 到 m 个 槽 位 中 的 任何 一 个 ,而 与 其 他 元 素 被 散 列 到 
哪个 槽 位 无 关 , 把 这 一 假定 称 为 简单 均匀 散 列 。 

对 j 二 0,1,…,m 一 1, 用 nj KERER T Lj THEE TV: 

n = n +m + ee + nea (2-1) 
H n; HFHH Eln; ]=a=n/m. 

假定 散 列 值 &(A) 可 以 在 O(1) 时 间 内 算得 ,所 以 查找 一 个 具有 关键 值 的 元 素 所 需 的 

时 间 线 性 地 依赖 于 链表 工 LACA)] 的 长 度 mo 。 先 不 管 计算 散 列 函数 及 访问 槽 位 h(k) 所 需 
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的 O(1) 时 间 , 考 虑 查找 算法 检测 过 的 元 素 个 数 的 期 望 值 , 即 在 链表 TLh(k)] 中 为 检测 关键 
值 是 否 为 k 而 考察 的 元 素 个 数 。 仅 考虑 查找 不 成 功 的 情形 , 即 散 列表 中 没有 关键 值 为 k 的 
元 素 。 查 找 成 功 所 用 的 时 间 一 定 不 会 多 于 查找 不 成 功 所 用 的 时 间 。 

引 理 2-3 在 一 个 利用 拉链 法 解决 冲突 的 散 列 表 中 ,在 简单 均匀 散 列 的 假定 下 ,不 成 功 
查找 的 期 望 时 间 是 OC. +a). 

证 明 在 简单 均匀 散 列 假设 下 , 任 一 尚未 存储 到 散 列表 中 的 关键 值 将 被 等 概率 地 散 
列 到 xm 个 槽 位 中 的 任何 一 个 。 对 一 个 关键 值 的 不 成 功 查找 的 期 望 时 间 是 搜索 到 链表 
T[h(k)] 的 表 尾 的 期 望 时 间 为 OA +a) ,该 拉链 表 的 期 望 长 度 Elmo] =a FE EK 
不 成 功 查 找 中 期 望 搜索 到 的 元 素 个 数 为 a, 且 所 需 的 总 的 时 间 ( 包 括 计算 h(k) 的 时 间 ) 为 
co, 

这 一 分 析 的 意义 何在 呢 ? 若 散 列表 的 槽 位 数 正比 于 其 中 的 元 素 个 数 , 有 n OG ,于 
是 ,a 二 n/m 二 OC(m)/m 二 0(1)。 因 此 ,查找 时 间 平 均 为 常数 。 由 于 插入 操作 首先 需要 调用 
CHAINED-H ASH-SEARCH 确认 元 素 c 的 关键 值 未 曾 出 现在 表 中 ,然后 用 O(1) 时 间 将 z 插 
和 人 到 链表 TDhCkey[xj)] 中 ,所 以 期 望 的 时 间 是 O(1)。 类 似 地 ,删除 操作 对 双向 拉链 表 平 均 
情形 时 间 也 是 OC ,所 以 所 有 的 字典 操作 可 以 在 O(1) 的 平均 时 间 内 得 到 支持 。 


2.5.3 散 列表 的 程序 实现 


1, 数据 类 型 定义 

在 C 语言 中 ,把 散 列表 定义 成 如 下 结构 体 。 

1 typedef struct { / * hash 表 结 构 * / 

2 LinkedList **table; /* 槽 位 数组 * / 

3 size tm; /* 槽 位 数 * / 

4 size t n; /* 元 素 个 数 */ 

5 ) Hash Table; 

6 HashTable * createTable(int m); / * 创建 具有 m 个 槽 位 的 hash 表 */ 
7 void clrTable(Hash Table* t); 

8 int tbIsEmpty( Hash Table* 0; /* 检测 表 空 x / 

9 int inHashTable( Hash_Table * t,unsigned key) ; /* 向 表 t 中 插入 元 素 key* / 
10 int hashInsert(Hash_Table * t,unsigned key); /* 在 表 t 中 查找 关键 值 key* / 
11 int hashDelete( Hash. Table * t,unsigned key) ; /* ER t 中 删除 元 素 key * / 


程序 2-30 ”定义 散 列表 数据 结构 及 声明 操作 函数 的 头 文件 stb. h 


对 程序 2-30 的 说 明 如 下 。 

COD 第 1 一 5 行 定义 的 是 散 列表 类 型 HashTable。 它 有 3 个 数据 属性 : 槽 位 数组 table, 
该 数组 的 元 素 是 存储 表 元 素 的 链表 ; 槽 位 数 m 和 表 内 元 素 个 数 n, 它 们 都 是 整 型 的 。 

(2) 第 6 行 . 第 7 行 声明 的 函数 createTable 和 clrTable 用 来 创建 散 列 表 和 清理 散 列 表 
的 存储 空间 。 第 8 行 声明 的 函数 tbIsEmpty 用 来 检测 散 列表 是 否 为 空 。 

(3) 第 9 行 一 第 11 行 声明 的 函数 inHashTable,hashInsert 和 hashDelete 将 分 别 实现 
算法 2-24 中 的 CHAINED-HASH-SEARCH, CHAINED-HASH-INSERT 和 CHAINED-HASH- 
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DELETE 过 程 等 字典 操作 。 
2. hash 表 的 常规 维护 


hash 表 的 常规 维护 操作 包括 创建 空 表 、 清 理 不 再 使 用 的 表 空间 以 及 检测 是 否 表 空 。 这 
些 操作 的 C 函数 定义 如 下 。 


1 HashTable* createTable(int m) { 


2 int i; 

3 HashTable * tab=(Hash_Table * ) malloc(sizeof (Hash Table)»; /* 分配 空间 */ 

4 assert(tab) ; 

5 tab->m=m; /* 设 置 槽 位 数 * / 
6 tab-»table— (LinkedList**) malloc(m * sizeof (LinkedList * )) ; /< 分 配 槽 位 * / 

7 assert(tab->table) ; 

8 tab->n=0; /* 元 素 个 数 初 始 化 * / 
9 for (i—0; im; i++) 

10 tab-»table[ i] = createList(sizeof unsigned) ,intGreater) ; /* 创建 槽 位 链表 * / 
11 return tab; 

12 } 

13 void clrTable( Hash Table* t) { 

14 int i; 

15 for (i=0; i<t->m; i++) 

16 clrListCt-»table[i], NULL) ; /* 清理 槽 位 链表 * / 
17 ÍreeCt-»table) ; / x 释放 槽 位 / 

18 } 

19 int tbIsEmpty(Hash Table* t) { 

20 return t->n == 0; 

21] 


程序 2-31 hash 表 的 常规 维护 函数 


对 程序 2-31 的 说 明 如 下 。 

CD 第 1 一 12 行 定 义 的 函数 createTable 创建 一 个 具有 参数 m 个 槽 位 的 散 列 表 ( 第 6 
行 )。 第 9 一 10 行 的 for 循环 为 每 一 个 槽 位 创建 一 个 链表 存储 整 型 数据 的 链表 ,因为 hash 
表 中 元 素 的 关键 值 是 非 负 整数 。 

(2) 第 13 一 18 行 定义 的 函数 clrTable 对 参数 t 指引 的 散 列表 清理 存储 空间 。 其 中 ,第 
16 行 调用 链表 清理 函数 清理 每 个 槽 位 链表 ,由 于 连 表 中 存储 的 结 点 数据 是 普通 的 非 负 整数 
类 型 数据 ,无 须 对 链表 结 点 的 key 域 做 特殊 处 理 , 故 传递 给 函数 clrList 的 第 2 个 参数 为 
NULL, 

(3) 第 19—21 行 定 义 的 函数 tbIsEmpty 检测 由 参数 t 指引 的 散 列表 是 否 为 空 , 它 以 t 
的 n 属 性 是 否 为 0 作为 判断 依据 (第 20 £D. 


3. hash 表 的 字典 操作 
集合 的 字典 操作 包括 查找 特定 值 元 素 、 添 加 元 素 和 删除 元 素 。 
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1 int inHashTable(Hash Table* t,int key) { 


€ 0 x3 O0 Oc & oto 


10 
11j 
12 int 
13 
14 
15 
16 
17 
18 
19 
20 } 
21 int 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35] 


int index; 
ListNode * node; 
if (tbIsEmptyCO) 
return 0; 
index— key % (t->m); 
node=listSearch(t->table[index],&-key) ; 
if (node! 一 t->table[index]->nil) 
return 1; 
return 0; 


hashInsert(Hash Table * t.unsigned key) { 
if (!inHashTable(t,key)) ( 
int index— key t-»m: 
listPushFront(t—table[ index]  &-key) ; 
t->n 十 十 ; 
return 1; 
) 


return 0; 


hashDelete( Hash. Table * t,unsigned key) ( 
int index; 
ListNode * node; 
if (tbIsEmpty CO? 
return 0; 
index—key % t-»m; 
node- listSearch(t-»table[ index ],&-key) ; 
if (node! — t-»table[ index]-»nil) ( 
listDeleteCt-»table[ index] » node) ; 
t->n—— 3 
free(node) ; 
return 1; 
) 


return 0; 


/ * 检测 key 是 否 在 表 中 * / 


/ * 计算 key 的 hash 函数 值 */ 
/* 到 指定 槽 位 中 去 查找 * / 
/ * BRB * / 


/* GRP key * / 
/ * 计算 key 的 hash 函数 值 * / 
/* 在 指定 槽 位 连 表 中 插入 */ 


/* 表 中 已 有 key*/ 


/* 计 算 key 的 hash 函数 值 * / 
/ 在 指定 槽 位 连 表 中 查找 */ 
/* 找 到 */ 


/* 表 中 无 keyx / 


程序 2-32 ”定义 散 列表 字典 操作 的 C 函数 


对 程序 2-32 说 明 如 下 。 


CD 第 1 一 11 行 定义 的 函数 inHashTable 实现 算法 2-24 中 的 CHAINED-HASH- 
SEARCH 过 程 。 该 函数 在 参数 t 指定 的 散 列表 中 查找 参数 key 确定 的 关键 值 。 若 表 中 存在 
这 个 关键 值 ,返回 1, 否 则 返回 0。 第 6 行 计算 key 的 hash 函数 值 index, 第 7 行 调用 程序 2-2 


定义 的 函数 listSearch 在 槽 位 链表 table[index] 中 查找 元 素 。 


(2) 第 12 一 20 行 定义 的 函数 hashInsert 实现 算法 2-24 中 的 CHAINED-HASH-INSERT。 
该 函数 在 参数 t 指定 的 散 列表 中 插入 关键 值 为 参数 key 的 元 素 。 插 入 成 功 ,返回 1, 否 则 返 
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回 0。 第 13 行 调用 inHashTable 函数 在 t 中 查找 key, 若 表 中 不 存在 这 样 的 元 素 , 第 14 fT 
计算 key 的 hash 函数 值 index, 第 15 行 调用 程序 2-4 中 的 函数 listPushFront 在 槽 位 链表 
table[index] 的 前 端 插 入 关键 值 为 key 的 结 点 。 

(3) 第 21 一 35 行 定义 的 函数 hashDelete 实现 算法 2-24 中 的 CHAINED-HASH-DELETE 
过 程 ,在 参数 t 指 定 的 散 列表 中 删除 关键 值 为 参数 key 的 元 素 ,删除 成 功 返 回 1 ,否则 返回 
0。 第 26 行 计算 key 的 hash 函数 值 index, 第 27 行 直接 调用 程序 2-4 中 的 函数 listSearch 
在 槽 位 链表 tableLindexj 中 查找 key, 第 28 行 若 检测 到 存在 这 样 的 结 点 , 则 在 第 29 行 调用 
函数 listDelete( 也 定义 在 程序 2-4 中 ) 将 该 结 点 删除 ,并 在 第 31 行 中 释放 其 空间 。 

为 便于 代码 重用 ,将 程序 2-30 存储 为 文件 夹 的 datastructure 中 的 头 文件 hstb. h, 将 程 
序 2-31 和 程序 2-32 的 代码 存储 为 同一 个 文件 内 的 源 文件 hstb. c。 


2.5.4 散 列 表 的 应 用 


散 列表 作为 动态 集合 ,常用 于 需要 进行 快速 查找 的 应 用 中 。 用 此 数据 结构 来 解决 下 列 
问题 。 


Crazy Search 


Description 

Many people like to solve hard puzzles some of which may lead them to madness. One 
such puzzle could be finding a hidden prime number in a given text. Such number could be 
the number of different substrings of a given size that exist in the text. As you soon will 
discover.you really need the help of a computer and a good algorithm to solve such a 
puzzle. 

Your task is to write a program that given the size, N ,of the substring.the number of 
different characters that may occur in the text. NC. and the text itself, determines the 
number of different substrings of size N that appear in the text. 

As an example. consider N — 3. NC — 4 and the text "daababac". The different 
substrings of size 3 that can be found in this text are: “daa”, "aab", "aba". “bab”, "bac". 
Therefore, the answer should be 5. 

Input 

The first line of input consists of two numbers. N and NC. separated by exactly one 
space. This is followed by the text where the search takes place. You may assume that the 
maximum number of substrings formed by the possible set of characters does not exceed 16 
Millions. 

Output 

The program should output just an integer corresponding to the number of different 
substrings of size N found in the given text. 


Sample Input 
34 
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daababac 
Sample Output 


5 
1. 问题 与 算法 的 描述 


该 问题 可 形式 化 地 描述 如 下 。 

输入 : EM cert tect 中 包含 的 不 同 字符 个 数 NC , 子 串 长 度 N。 

输出 : rece 中 长 度 为 N 的 不 同 子 串 个 数 。 

解决 此 问题 的 思想 非常 简单 , 设 S 为 一 动态 集合 ,初始 化 为 空 。 从 text 首 起 ,逐一 提取 
长 度 为 N MEP substr H substr&S, 则 将 substr 添加 到 S 中 。 最 后 返回 S 中 的 子 串 个 数 
即 为 所 得 。 动 态 集合 S 可 以 用 链表 、 二 叉 搜 索 树 等 各 种 数据 结构 加 以 表示 。 然 而 , 本题 要 
求 存储 在 集合 S 中 的 子 串 要 求 两 两 不 等 ,这 恰好 符合 散 列表 中 元 素 关键 值 两 两 不 等 的 特 
性 。 重 要 的 是 如 何 将 串 转 换 成 散 列 表 中 元 素 的 整数 关键 值 。 转 换 的 思路 是 ,建立 一 个 
NC 进 制 整数 系统 ,iezt 中 的 每 一 个 字符 对 应 该 系统 中 的 一 个 数字 ,iezt 中 的 每 一 个 长 度 为 
N 的 子 串 , 唯 一 地 对 应 该 整数 系统 的 一 个 N 位 数 ,将 此 数 作为 该 子 串 加 入 到 散 列 表 中 的 关 
键 值 。 具 体 算法 伪 代 码 描述 如 下 。 

CRAZY-SEARCH (text, N, NC) 


1 len<-length[tezxt] 


2 为 整 型 数组 分 配 256 个 元 素 空间 并 将 每 个 元 素 初始 化 为 0 


3 for i<-0 to len—1 D MEHAR text 的 不 同 字符 

4  dob[texi[i]]1 

5 v0 

6 for i<-0 to 255 

7 do if b[i] 40 DX text 中 的 每 个 不 同 字符 确定 NC 进 制 编码 值 
8 then /[i]*—v 

9 v*-vl 

10 hØ 上 创建 空 的 hash # h 

11 for i<-0 to len - N—1 DX text 的 每 一 个 长 度 为 N 的 子 串 

12 do key<0 

13 for j<0 to N 一 1 上 计算 该 子 串 对 应 的 NC 进 制 值 

14 do key<key * NC+b[textlit+j]] 

15 HASH-INSERT(A key) D hash 表 仅 能 插入 关键 值 不 重复 的 元 素 


16 return size[A] 


算法 2-27 fH Crazy Search 问题 的 CRAZY-SEARCH 过 程 


算法 过 程 中 设置 一 个 具有 256 个 元 素 的 数组 b, 用 来 计算 text 中 的 NC 个 字符 对 应 NC 
进 制 整数 系统 的 数字 值 。 第 3 行 和 第 4 行 的 for 循环 通过 扫描 text 标记 出 其 中 NC 个 字 
符 。 第 6 一 9 行 的 for 循环 为 此 NC 个 字符 计算 对 应 的 数字 值 。 第 13 行 和 第 14 行 的 for 循 
环 计算 一 个 子 串 对 应 的 关键 值 。 


2. 程序 实现 
利用 程序 2-30 程序 2-21 及 程序 2-23 开发 的 散 列 表 Hash_Table, 我 们 将 解决 Crazy 
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Search 问题 的 算法 2-27 的 CRAZY-SEARCH 过 程 实现 为 如 下 函数 。 

1 int cracySearch(char * text,int n.int nc){ 

2 int i,j, len=strlen(text) ,v=0, result; 

3 int b[256]— (0) ; 

4 Hash Table * h; 

5 i-0; 

6 while( * Ctext-Fi) ! —^05( / * 确定 组 成 串 text 的 字符 * / 

z b[ * (text+i) J=1; 

8 i++; 

9 } 

10  for(i—0;i-256;id- 4-) / * 对 组 成 串 text 的 各 字符 确定 编码 值 * / 

11 if(bLi]) 

12 blil=v++; 


13 h=createTable((int)((len—n) * 0.75)); /* 装载 因子 设 为 0.75* / 
14 — for(i—-0;i- —len-n;id- +){ 


15 int key—0; 

16 for(j—0;j nij +) /* 计算 子 串 的 关键 值 * / 
17 key— key * nc 十 b[ * (text 十 i 十 j)]; 

18 hashInsert(h, key) ; 

19 } 

20 result=h->sizes /* 不 同 的 子 串 数 * / 


21 clrTableCh, NULL); 
22 Íree(h) ; 

23 return result; 

24) 


程序 2-33 ”实现 算法 2-25 CRAZY-SEARCH 过 程 的 C 函数 


函数 代码 与 算法 伪 代 码 十 分 相似 ,需要 注意 的 是 第 13 行 调用 函数 createTable 创建 散 
列表 h 时 ,参数 (len 一 n) * 0.75 表示 用 装载 因子 a= 0. 75 决定 散 列 表 的 槽 位 数 。 其 中 len 
是 串 text 的 长 度 ,n 是 子 串 长 度 ,len-n 恰 为 text 中 所 有 长 度 为 n 的 子 串 数 ,也 就 是 本 问题 中 
可 能 加 入 hash 表 的 最 大 元 素 个 数 。 调 用 该 函数 解决 Crazy Search 问题 的 程序 存放 在 文件 


3€ chap02/Crazy Search 的 源 文件 CrazySearch. c 中 。 
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人 们 在 解决 复杂 的 问题 时 ,思维 方向 通常 有 两 个 : 集 零 为 整 和 化 整 为 零 。 集 零 为 整 的 
思路 就 是 以 累加 或 扩张 的 方式 由 点 连 线 ,由 线 及 面 ,从 部 分 的 解 扩 展 成 完整 的 解 。 化 整 为 零 
的 思路 则 是 相反 ,将 一 个 复杂 的 问题 分 解 成 较 小 的 问题 ,继续 分 解 , 直 至 能 直接 解 得 为 止 。 
这 样 的 思维 方法 ,用 在 算法 设计 上 就 形成 了 两 种 基本 的 算法 设计 策略 : 渐 增 策略 和 分 治 策 
略 。 本 章 通过 一 些 简 单 而 又 经 典 的 例子 说 明 这 些 策 略 的 应 用 。 


3.1 渐 增 型 算法 


从 讨论 一 类 最 简单 的 算法 设计 策略 一 一 渐 增 型 算法 开始 。 渐 增 型 算法 指 的 是 算法 使 问 
题 的 解 从 较 小 的 部 分 渐渐 扩张 ,最 终 成 长 为 问题 的 完整 解 。 运 用 渐 增 型 策略 的 算法 有 一 个 
共同 的 特征 : 构成 算法 的 主体 是 一 个 循环 结构 , 它 逐 步 将 部 分 解 扩展 成 一 个 完整 解 。 该 循 
环 将 遵循 一 个 始终 不 变 的 原则 : 每 次 重复 之 初 ,总 维持 着 问题 的 一 个 部 分 解 。 人 们 将 此 特 
征 称 为 算法 的 循环 不 变量 。 利 用 循环 不 变量 来 证 明 渐 增 型 算法 的 正确 性 是 软件 正确 性 证 明 
的 一 个 很 好 的 方法 。 具 体 的 做 法 是 , 先 用 数学 归纳 法 证 明 循环 不 变量 的 正确 性 ,然后 利用 循 
环 不 变量 说 明 主 循环 结束 时 将 得 到 关于 问题 的 一 个 完整 解 。 本 节 介 绍 两 个 典型 的 渐 增 型 算 
法 ,讨论 它们 的 正确 性 ,指出 它们 的 效率 ,并 用 C 语言 加 以 实现 。 


3.1.1 有 序 序列 的 合并 问题 


1. 问题 的 描述 


将 两 个 有 序 序列 合并 为 一 个 有 序 序列 问题 的 形式 化 表示 如 下 。 

输入 : 序列 ALp.. 门 。 其 中 , 子 序列 Ap. .gq] 和 ALg 十 1. .7J 是 有 序 的 。 

输出 : AL p. . 门 所 有 元 素 的 重 排 ,使 之 有 序 。 

可 以 用 一 个 渐 增 型 算法 解决 此 问题 。 首 先 , 把 ALp. .qj 和 ALg 十 1. .J 分别 复制 到 序列 
LUL. o JARO. . nm BB om 二 gq 一 p 十 1,ns 二 7r 一 gq。 然后 ,维护 3 个 变量 ij RUE iU WI 
WOW Lok IAE pe keg LONS R[ 门 :将 较 小 者 复制 到 AD] E is; 和 使 得 它们 各 
自 指向 L、R 和 A 的 合适 的 位 置 : 车 工 [站 二 R[ 站 , 则 i 增加 1, 否 则 j 3n 1. 2616 n fap e 6 
要 增加 1。 循 环 往复 ,直至 L AR 之 一 被 扫描 完 。 然 后 ,将 另 一 个 序列 中 尚 存 的 元 素 复制 到 
AL[&A. . 门 。 在 此 过 程 中 ,AL2. .& 一 1] 中 的 元 素 是 AD p. .rj 中 的 最 小 的 & 一 p 个 元 素 , 并 且 已 
排 好 序 。 随 着 的 增长 AD p. .kj 渐 增 为 一 个 有 序 序列 。 图 3-1 展示 了 一 个 例子 。 

图 3-1 所 示 为 当 子 数组 A[9.. 16 ] 846 € 90 2.4.5.7.1.2.3.67 IF, A[9.. 12] 和 
A[13.. 16] 为 两 个 有 序 的 子 序列 。 使 用 两 个 辅助 序列 工 和 尺 进行 合并 操作 。 在 复制 后 , 序 


第 3 章 基本 算法 设计 策略 


8 9 10 11 12 13 14 15 16 17 


a- IES a eis) … 


8 9 10 11 12 13 14 15 16 17 


4 


k 
1234 y 2 


5 


k 
1 2 4 1 


3 4 
2|«[s]y] El2fsfal 
LI J 

(a) 

8 9 10 11 12 13 14 15 16 17 


4~ BE «p pps 


3 234 
L[2|4|5]|7 RGB 
i j 
(b) 
8 9 10 11 12 13 14 15 16 17 


4 BRT E M 


k 


12 4 
/ 圆 41517| Mele] 
i 


p 
> 


8 9 1011 12 13 14 15 16 17 


naga ang 
1234 F2 374 
L J 
(e) 
8 9 1011 12 13 14 15 16 17 
k 
1234 1234 
£ J 
(g) 


k 
1234 1234 


Pebr] mEes 
J 


i 


~ 


8 9 1011 12 13 14 15 16 17 
Ae BoE 


k 
1 2.3 4 1234 


8 9 10 11 12 13 14 15 16 17 


k 
123 4 123 4 


L naaa 
i j 


(h) 


图 3-1 有 序 序列 的 合并 


列 荆 包含 二 2,4,5,7 二 ,序列 及 包含 一 1,2.3,6 二 。A 中 深 灰 色 的 位 置 包含 最 终 值 ,L AR 
中 浅 灰色 位 置 包含 的 值 尚未 复制 回 A 中 。A 的 浅 灰色 位 置 是 将 被 覆盖 的 ,而 和 RR PRR 
色 位 置 包含 的 是 已 经 被 复制 回 A 的 值 。 图 3-1(a) 一 图 3-1(g) 是 算法 3-1 中 第 12—17 行 的 
while 循环 每 次 重复 之 初 的 AL 、R 及 其 下 标 人 ij。 图 3-1(h) 是 执行 了 算法 3-1 中 第 18 一 
21 行将 工 中 剩余 的 元 素 复 制 到 A[LA. . 门 中 。 此 时 , 子 序列 A[9..16] 已 经 排 好 序 。 


2. 算法 的 伪 代 码 描述 


很 容易 将 上 述 的 算法 思想 描述 为 下 列 的 伪 代 码 过 程 。 


MERGE(A, p»q»r) 

lm-4—p-1 

2n-r—q 

3 创建 数组 LCL . nm T RCL . n] 
4 for i<-1 to m 

5 doL[i]-A[p+i—1] 

6 for j--1 to n; 

7 doR[j]—-A[qtj] 

8i—l 
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9 j--1 

10 k<p 

11 while ¿Sm and j n; 
12 do if L[i]<R[j] 


13 then A[4]--L[ i] 

14 iit] 

15 else ALE]--Rj] 

16 sl 

17 kek+1 

18 if in 

19 then 将 L[i. .nj 复制 到 ALA. . r] 
20 if jn 


21 then 将 R[j.. ns] 复 制 到 ACA. . 7] 
算法 3-1 解决 有 序 子 序列 合并 问题 的 MERGE 算法 


3. 算法 的 正确 性 


MERGE(A,p,q,7) 是 把 存储 在 AD p. .qj 和 A[Lg 十 1..r] 这 两 部 分 中 的 有 序 子 序列 合并 
到 AL2.. 门 并 使 其 有 序 。 随 着 第 12 一 17 行 的 for 循环 的 重复 ,部 分 解 A[p. .kj 逐渐 扩充 为 
全 部 解 ALp.. 门 。 由 此 可 总 结 出 如 下 的 循环 不 变量 。 

在 第 12 一 17 行 的 while 循环 的 每 次 重复 之 初 , 子 数组 ALp..& 一 1j 包 含 L[1..mj] 和 
ROL. . ns] 中 的 一 p 个 最 小 的 元 素 , 并 排 好 序 。 此 外 , 工 [ 门 和 R[ 站 分 别 是 各 自 数组 中 尚未 
复制 回 数组 A 的 元 素 中 的 最 小 者 。 

利用 此 循环 不 变量 来 证 明 合 并 算法 MERGE 是 正确 的 。 

首先 ,对 变量 & 做 数学 归纳 。 

CD WH k=p. WEN. ALp.. k-1J=@. IAk LOJ RCI] 分 别 是 各 自 数 组 中 尚未 
复制 回 数组 A 的 元 素 中 的 最 小 者 。 所 以 ,循环 不 变量 自然 为 真 。 

(2) 设 p<k<r, 且 重复 之 初 循环 不 变量 为 真 , 即 ALp. .一 1j 包 含 L[1..mj] 和 R[1 .. m] 
中 的 & 一 p 个 最 小 的 元 素 , 并 排 好 序 。 此 外 ,LL[ 门 和 RL] 分别 是 各 自 数组 中 尚未 复制 回 数 组 
A 的 元 素 中 的 最 小 者 。 在 此 假设 下 ,本 次 重复 中 ,第 13 一 16 行将 把 [让 和 R[ 站 两 者 的 较 小 
者 复制 到 ARIES LR 的 有 序 性 知 ,此 时 AD p.. k JAR LL1..m JARO ..z] 中 的 
k— p 1 个 最 小 的 元 素 ,并 排 好 序 。 若 工 [如 较 小 , 则 i 增加 1, 否 则 j 增加 1。 此 时 仍 有 工 [站 
Al R[ 门 分 别 是 各 自 数组 中 尚未 复制 回 数组 A 的 元 素 中 的 最 小 者 。 这 一 状态 将 持续 到 下 一 
次 重复 之 初 。 那 时 ,k 增值 1, 则 此 状态 应 描述 为 : Alp.. k-1) 4% LCL . m IRI ROL .. n] 
中 的 & 一 户 个 最 小 的 元 素 , 并 排 好 序 。 此 外 , 工 [和 RL7 门 分 别 是 各 自 数 组 中 尚未 复制 回 数组 
A 的 元 素 中 的 最 小 者 。 这 恰 为 循环 不 变量 ! 

这 样 就 证 明了 上 述 循环 不 变量 是 正确 的 。 于 是 ,第 12 一 17 行 的 while MHZ AEM i>, 
3X jn. HVA EAL... kR-1) 0% L[1..m JARO ..nz] 中 的 & 一 p 个 最 小 的 
元 素 ,并 排 好 序 。 第 18 一 21 行将 尚 存 于 工 或 R 中 的 r+ 一 k 十 1 个 元 素 ( 是 有 序 的 ) 复 制 到 
ALR. .rj 中 ,使 得 ALp. .J 为 有 序 ,这 正 是 要 求 的 结果 。 
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4. 算法 的 运行 时 间 


假定 ALp. .rj 含有 n(n 二 r 一 p 十 1) 个 元 素 。 第 4 行 ~~ 第 7 行 的 for 循环 均 重复 nn 次 。 
此 外 ,第 12 一 17 行 的 while 循环 重复 k 一 p 次 ,第 18 一 21 行 中 的 for 循环 将 重复 7 一 p 十 1 次 ， 
两 者 一 共 耗 时 8(n)。 所 以 算法 的 最 坏 情 形 时 间 为 OG) 。 


5. 程序 实现 


这 个 过 程 是 一 个 有 效 的 排序 算法 一 一 归并 排序 中 的 关键 过 程 ,所 以 ,要 来 实现 它 。 

1) 数组 版 本 

首先 ,利用 void * 指针 的 方法 来 实现 一 个 能 对 任意 类 型 数组 进行 合并 的 通用 的 C 函数 。 
为 便于 代码 重用 ,在 头 文件 merge. h 中 声明 函数 : 


void merge(void * a,int size, int p,int q,int r,int( * comp)(void * ,void * )); 


该 函数 对 存储 在 指针 a 指向 的 内 存 中 每 个 元 素 的 存储 宽度 为 size 的 数组 中 有 序 子 数组 
alp.. qdj 和 a[q 十 1. .器 进行 合并 。 数 组 中 的 元 素 大 小 比较 规则 由 参数 comp 确定 。 该 函数 
的 定义 如 下 。 


1 void merge(void * a,int size,int p,int q,int r,int( * comp)(void * ,void * )){ 


int i,j,k,nl 一 q 一 p 十 1,n2 一 r 一 q; 

void * L— (void * ) malloc(nl * size) ; 

void * R— (void * ) malloc(n2 * size) ; 

memepy(L, (char * )a-- p * size,nl * size) ; / * Xt alp.. q) 5 8I L[1.. n1] * / 
memcpy(R. (char * )a 十 (q 十 1) * sizesn2 * size);  /* 将 a[q 十 1.. 品 复制 到 R[1..n2]* / 
i=j=0; 


k=p; 
while(i<n1& &j<n2) 
if(comp(L+i * sizes R+j * size) <0) / * LLi]« Rj] * / 
memcpy(a 十 (k 十 十 ) * sizes L-- Cid- +) * sizessize) ; / * a[k]«-LLi] * / 
else 
memcpy(a 十 (k 十 十 ) * size,R 十 (j 十 十 ) * size, size) ; / * alLk]-- R[j] * / 
ifGi<nl) 


memepy(a+k * size, L+i * size,(nl—i) * size); / * #§ LCi. . n1] fll alk. r] * / 
if(j— n2) 

memopy(a--k * size, R+j * size. (n2—j) * size); / * ¥ R[j.. n2] dl Sl alk. . r] * / 
free(L) ; L- NULL; 
free(R) ; R- NULL; 


程序 3-1 实现 算法 3-1 的 C 函数 merge 


对 程序 3-1 的 说 明 如 下 。 

(1) 函数 merge 有 6 个 参数 .其 中 a、p、q\r 与 MERGE 过 程 的 参数 A、p、g\r 对 应 。 由 于 
a 是 void * 类 型 的 ,所 以 本 函数 可 以 对 各 种 类 型 的 数组 做 合并 操作 。 参 数 size 的 意义 是 指 
定 存储 在 数组 a 中 的 元 素 的 实际 长 度 ,参数 comp 的 意义 是 确定 数组 a 中 元 素 大 小 比较 的 
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规则 。 

(2) 第 5 行 和 第 6 行 调用 库 函 数 memcpy 实现 MERGE 过 程 中 的 第 4 行 和 第 5 行 两 行 
子 数 组 复制 的 操作 。 第 9 一 13 行 的 while 循环 对 应 MERGE 过 程 中 第 9 一 15 行 的 while fff 
环 。 注 意 , 对 void* 指针 指向 内 存单 元 的 赋值 操作 由 函数 memcpy 完成 。 第 14 一 15 行 和 第 
16 行 和 第 17 行 分 别 对 应 MERGE 过 程 中 第 16 一 19 行 的 剩余 子 数组 复制 操作 。 

(3) 第 18 行 和 第 19 行 释放 指针 LR 指示 的 内 存 空 间 ,以 防 内 存 泄漏 。 

为 便于 重用 ,把 merge 函数 写 在 源 文件 merge. c 中 ,并 连同 头 文件 merge. h 存放 在 目 
录 Utility 中 。 

2) 链表 版 本 

事实 上 ,序列 在 计算 机 中 既 可 以 表示 成 数组 ,也 可 以 表示 成 链表 。 有 序 序列 的 合并 问 
题 , 也 可 能 发 生 于 用 链表 表示 的 序列 上 。 利 用 第 2 章 讨论 过 的 通用 双向 链表 LinkedList, 可 
以 在 C 语言 中 将 MERGE 过 程 实现 为 如 下 链表 版 本 。 


1 void listMerge(LinkedList * A,ListNode * p,ListNode * q.ListNode * r){ 
2 LinkedList * L=createList( A—>eleSize, A->comp) , 
* R=createList( A->eleSize, A->comp) ; 
3 ListNode *i, *j, * k; 
4 assert(L&.&R); 
5 i=p; 
6 — dol /* 将 a[p..q] 复 制 到 Lx / 
T listPushBack(L i-»key) ; 
8 i—i-»next; 
9 ) while(i!—q-»next ; 
10 j-—q-»next; 
11 dof / * WE a[q 十 1.. 品 复制 到 Rx / 
12 listPushBack(R ,j->key); 
13 j=j->next; 


14 }while(j!=r->next) ; 


15 i=L->nil->next,j=R->nil->next,k=p; 

16 while(i! —L-»nil&-&j! — R-»niD ( 

17 if(A->comp( (char * )i->key, (char * )j->key)<0) { / * LL] RLjl * / 

18 memepy( (char * )k->key, (char * )i->key, A->eleSize) ; / * ALk]--LLi] * / 

19 i=i->next; /*i-itl*/ 

20 Jelse( 

21 memopy( (char * )k->key, (char * )j->key, A-»eleSize) ; / * A[k]-- RD] * / 

22 j=j->next; /[*jejt1*/ 

23 .] 

24 k=k->next; /*kek+1*/ 

25 } 

26 ifü!—L-»niD 

27 — whilei! —L-»niD( / * ¥ LUi.. n1] fs] A[k.. r] * / 
28 memcpy( (char * )k—>key, (char * )i->key, A—>eleSize) ; 

29 i—i-»next. k— k-»next; /* icitlke—ktl*/ 
30 ) 
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31 ifG!—R-»niD 


32 while! — R-»niD( / * Y RO.. 0215 $8151 ACK. 1] / 
33 memcpy( (char * ) k-»key. (char * )j->key, A—>eleSize) ; 

34 j7j-»next, k— k-»next; /* jejtlk-krl*/ 

35  } 


36 clrList(L, NULL) ,free(L); 
37 clrList(R, NULL) , free(R) ; 
38) 


程序 3-2 ”实现 算法 3-1 的 C 函数 链表 版 本 listMerge 


对 程序 3-2 的 说 明 如 下 。 

CD 函数 listMerge 有 4 个 参数 。 参 数 A 表示 链表 Alp... r) AR pqr 分 别 是 指向 序 
列 A 的 首 元 素 . 中 点 元 素 和 尾 元 素 的 指针 。 

(2) 与 程序 3-1 中 函数 merge HIE LR 分 别 定义 成 链表 类 型 而 非 数 组 。 同 时 ,变量 i、 
jk 也 定义 成 了 指向 链表 结 点 的 指针 类 型 而 非 表 示 数 组 下 标的 整 型 。 

CD 将 程序 3-1 中 所 有 对 数组 元 素 的 访问 替换 成 对 链表 结 点 的 访问 ,下 标的 自 增 换 成 
取 下 一 个 结 点 的 操作 ,就 形成 了 程序 3-2 中 相应 的 代码 。 注 意 ,第 36 行 和 第 37 行 调用 函数 
clrList 清理 链表 L,R 的 空间 ,然后 释放 指针 L、R。 

为 便于 重用 ,将 函数 listMerge 的 定义 代码 存储 为 utility 文件 夹 内 的 源 文件 listmerge. c, 
并 将 该 函数 的 原型 声明 


void listMerge(LinkedList * A,ListNode * p,ListNode * q.ListNode * r); 
存储 在 头 文件 listmerge. h 中 。 


3.1.2 序列 的 划分 问题 


l. 问题 的 描述 


在 序列 的 划分 问题 中 ,操作 的 对 象 是 一 个 表示 成 序列 的 全 序 集 。 操 作 的 目标 是 将 该 序 
列 分 成 前 后 两 部 分 ,使 得 前 一 部 分 元 素 的 值 小 于 后 一 部 分 中 元 素 的 值 。 形 式 化 描述 如 下 。 

WA. 表示 成 序列 的 全 序 集 A[p. . 门 。 

输出 : 下 标 g(p 三 g 二 7), 原 序列 ALp. . 门 的 一 个 重 排 : 使 得 AL p. .gj 中 的 元 素 值 不 超 
it ALa] ,而 ALo 十 1.. 门 中 的 元 素 值 均 大 于 AL]. 

解决 此 问题 的 算法 对 序列 A p. . 门 进行 原 地 重组 。 算 法 选择 元 素 zx 一 A[ 站 ] 作 为 基准 元 
素 , 以 它 为 分 界 点 对 序列 AL p. . 门 进行 划分 ,目标 是 将 其 分 成 前 后 两 段 ALp. .gj 和 ALg 十 
1. .中 ,使 得 ALp. .gj 中 的 元 素 值 不 超过 zz. 而 ALg 十 1. .rj 中 的 元 素 值 大 于 x。 算法 维护 两 
个 下 标 值 i 和 j ,初始 时 分 别 为 p 一 1 和 p。 让 j 在 [p..7) 中 扫描 ,车 A[j] 志 A[xj], 则 将 
AL[j] 与 A[i 十 1] 交 换 , 然 后 i 增加 1。 这 样 ,在 此 过 程 中 ,A[Lzp. .站 中 的 元 素 均 不 超过 AL). 
而 A[i 十 1..j 一 1] 中 的 元 素 大 于 AL[Lr]。 随 着 j 的 增加 ,A[zp. .让 和 ALi 二 1..j 一 1] 也 随 之 增 
长 ,最 终 j 达到 7 一 1, 并 将 A[i 十 1] 与 A[ 门 交换 ,返回 ;十 1 即 为 所 求 的 g。 例 如 ,对 图 3-2 
中 所 示 的 序列 进行 的 操作 。 
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(i) 
图 3-2 序列 划分 操作 


图 3-2 所 示 为 对 样本 序列 二 2,8,7,1,3,5,6,4 记 的 划分 操作 。 浅 阴影 序列 元 素 都 在 第 
一 部 分 ACD. .可 中 ,其 值 都 不 大 于 工 。 深 阴影 元 素 都 在 第 二 部 分 A[i 十 1..j 一 1] 中 ,其 值 都 
大 于 zx。 无 阴影 元 素 是 尚未 进入 上 述 两 个 部 分 的 元 素 , 黑 色 元 素 是 基准 元 素 。 图 3-2(a) 为 
初始 的 序列 和 变量 设置 。 没 有 任何 元 素 进 入 上 述 两 部 分 。 图 3-2(b) 一 图 3-2(h) 表 示 算 
法 3-2 中 第 3 一 6 行 的 for 循环 的 每 一 次 重复 。 黑 色 双 向 箭头 表示 第 6 行 的 元 素 交 换 操作 。 
图 3-2(iD 表 示 上 述 循环 终止 后 第 7 行 执行 的 元 素 交 换 操作 。 


2. 算法 的 伪 代 码 描 述 


PARTITION(A, pyr) 

1 a~Alr] 

2i<p-1 

3 for j~ptor—1 

4 do if A[;]&« 

5 then i<-i+1 

6 exchange A[i] ^ ALj] 
7 exchange A[i+1]+A[r] 

8 return i 十 1 


算法 3-2 解决 划分 问题 的 PARTITION 算法 


3. 算法 的 正确 性 
在 此 过 程 的 运行 中 ,序列 被 分 成 4 个 (可 能 有 些 为 空 ) 部 分 : AL. iJ Alit 


ied — M. 
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A[j. .7 一 J 和 A[r]。ALzp. .可 中 的 元 素 值 不 超过 A[rj,A[i 十 1..; 一 1] 中 的 A[r]、ALj..r 一 1] 
中 的 元 素 尚未 处 理 过 。 随 着 算法 中 第 3 一 6 行 的 for 循环 的 重复 ,A[p. i EL AD 1..j—1] 
的 范围 逐渐 扩大 ,最 终 使 得 A[ p. .可 中 的 元 素 不 超过 A[i 十 1],A[i 十 2. . 门 中 的 元 素 大 于 A 
Lic-1]. 3& Mff ;十 1 就 是 划分 的 分 界 点 g。 在 第 3 一 6 行 的 for 循环 的 每 次 重复 之 初 ,每 一 
部 分 满足 一 定 的 性 质 , 这 些 性 质 可 陈述 为 一 个 循环 不 变量 。 

在 第 3 一 6 行 的 for 循环 的 每 次 重复 之 初 , 对 每 一 个 数组 下 标 k: 

CD 车 pki, W A[k]<z; 

(2) 3 i1 kj —1,9 ALR] >2; 

G) Æ k—r. W A[k]=z。 

用 此 循环 不 变量 来 证 明 算法 3-2 的 正确 性 。 首 先 , 对 7 做 数学 归纳 。 

(D j—pH.i—p-—1. Ma. Lp. =O. 循环 不 变量 中 的 (1) 自 然 成 立 。[i 十 1， 
j 一 1] = 你, 所 以 循环 不 变量 中 的 (2) 也 成 立 。 由 第 1 行 知 , 若 k==r,A[k]= 二 A[r]= 二 zx, 此 为 
循环 不 变量 中 的 (3) 。 

© 假定 pj<r—1 时 ,循环 不 变量 成 立 , 即 本 次 重复 之 初 条 件 (1)、(2)、(3) 都 成 立 。 
考察 本 次 重复 所 执行 的 操作 : 如 果 AD; ]-— W A[ 门 与 A[i 十 1] 交 换 , 且 i 增加 1。 这样 
AL p. . 门 中 的 元 素 不 超过 zx, 下 次 重复 之 初 就 使 得 循环 不 变量 的 条 件 (1) 成 立 。 如 果 AD] 
Zsi 不 变 ,也 不 做 其 他 任何 操作 。 这 使 得 下 次 重复 之 初 保持 本 次 重复 之 初 的 条 件 (1) 成 立 。 
总 之 ,无 论 如 何 , 本 次 重复 结束 时 的 状态 ,也 就 是 下 次 重复 之 初 的 状态 将 维持 条 件 (1) 的 成 
立 。 由 于 本 次 重复 之 初 A[i 十 1. .一 1] 中 元 素 大 于 zx。 本 次 重复 中 , 若 发 生 A[j] 与 A[i 十 1] 
ZEAL <x) W ; dj 1 且 此 时 A[ 门 这 z, 也 就 是 说 无 论 如 何 A[i 十 1. . 门 中 元 素 大 于 
Z。 本 次 重复 完成 下 次 重复 之 初 ,) 将 增加 1, 这 意味 着 A[i 十 1..j 一 1] 中 元 素 大 于 zx, 这 是 
循环 不 变量 的 条 件 (2) 。 至 于 条 件 (3), 则 所 有 的 重复 中 ,A[ 门 没有 发 生变 化 ,始终 为 z。 

由 此 可 见 ,该 算法 的 循环 不 变量 是 正确 的 。 在 第 3 一 6 行 的 for 循环 终止 时 , 按 循环 不 
变量 Ap. . 门 中 元 素 不 超过 zx,A[i 十 1. .7 一 1] 中 元 素 大 于 x。 第 7 行 交 换 A[i 十 1] 和 A[r] 
就 使 得 AD p. .i 十 1] 中 元 素 不 超过 A[i 十 1], 而 ALi 十 2.. 门 中 元 素 大 于 A[i 十 1]。 这 正 是 要 
求 的 划分 结果 ,i 十 1 就 是 分 界 点 元 素 的 下 标 。 


4. 算法 的 运行 时 间 

假定 序列 ALp. .rj 中 含有 个 元 素 。 在 此 过 程 中 ,第 3 一 6 行 的 for PAB TL nk, 
所 以 该 算法 的 最 坏 情形 运行 时 间 为 OC) 

5. 程序 实现 

这 个 过 程 在 很 多 有 趣 的 算法 中 都 有 应 用 ,所 以 要 把 它 认 真 地 加 以 实现 。 

1) 数组 版 本 

由 于 C 语言 中 没有 提供 交换 两 个 变量 的 值 的 库 函 数 ,而 在 程序 设计 中 ,经 常会 遇 到 这 
样 的 操作 ,例如 ,在 实现 PARTITION 过 程 时 ,第 6 行 和 第 7 行 就 需要 进行 这 一 操作 。 完 成 两 
个 变量 值 交 换 的 C 源 代码 文件 swap.c 如 下 。 


1 void swap(void * x.void * y,int size) ( 


2 void * temp- (void * ) malloc(size) ; 
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memcpy( temp, x; size) ; 
memepy(x,y, size) ; 
memcpy(y, temp, size) ; 


free(temp) ; 


o wc & w 


程序 3-3 ”完成 两 个 变量 值 交换 的 C 源 代码 文件 swap. c 


对 程序 3-3 的 说 明 如 下 。 

(1) 函数 swap 有 3 个 参数 : void * 指针 型 的 x y 和 整 型 的 size。 前 两 者 提供 需要 交换 
值 的 两 个 变量 的 地 址 ,第 3 个 参数 size 则 指出 存储 于 这 些 地 址 中 的 数据 的 实际 长 度 。 之 所 
以 要 用 void * 指针 ,是 希望 该 函数 能 适用 于 任何 数据 类 型 。 由 于 交换 的 结果 维持 于 x. y 所 
指向 的 地 址 中 ,所 以 无 须 返 回 值 。 

(2) 第 5 行 声明 的 局 部 变量 temp 扮演 交换 变量 值 时 的 中 转角 色 。 

(3) 除了 用 memcpy 充当 赋值 操作 外 ,与 常 做 的 交换 两 变量 的 值 的 操作 他 辑 是 一 样 的 。 

为 便于 重用 ,把 这 段 代码 存储 于 Utility 目录 的 源 文件 swap. c 中 , 且 将 该 函数 的 原型 声 
明 存储 为 头 文件 swap. h。 利 用 swap 函数 ,按照 算法 3-2 的 伪 代 码 描述 ,将 其 实现 为 如 下 的 
C 函数 。 

1 # include 'swap. h" 

2 long partition(void * a,int size,int p,int r,int( * comp) (void * ,void * ))( 


3 int i,j; 

4 void * x= (void * )malloc(size) ; 

5 memcpy(xya 十 rx sizeysize) ; /*x<aLr]*/ 

6 i-p—1; 

E for(j=p;j<r3j+t+) 

8 if(comp(a+j * size,x)<=0){ / * a[j]&x* / 

9 itt; 

10 swap(a+i * sizes a--j * size, size); / * alilalj] * / 
11 } 

12 free(x) ; 

13 swap(at+(i+1) * size,atr * size, size) ; / * alitljea[r] * / 
14 return i1; 

15) 


程序 3-4 ”实现 算法 3-2 的 C 函数 partition 的 定义 


对 程序 3-4 的 说 明 如 下 。 

(1) partition 函数 有 5 个 参数 : 其 中 a pr 对 应 于 PARTITION 过 程 的 参数 A、p、r。 注 
Eka 的 类 型 是 void * ,这 意味 着 该 函数 能 对 任何 类 型 的 数组 做 划分 操作 。 参 数 size 是 确定 
a 中 元 素 的 存储 长 度 , 参 数 comp 确定 a 中 元 素 大 小 比较 规则 。 函 数 将 返回 分 界 点 元 素 的 
下 标 。 

(2) 第 4 行 声明 void * 型 的 变量 x 对 应 于 算法 中 同名 的 暂 存 ALr] 的 值 的 临时 变量 。 

G) 只 要 把 伪 代 码 中 的 赋值 操作 代 之 以 函数 memepy 的 调用 ;数组 元 素 A[ 门 的 访问 代 
之 以 a 十 ix size; 交 换 元 素 操作 代 之 以 函数 swap 的 调用 , 则 程序 代码 几乎 就 是 伪 代 码 的 
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翻版 。 

为 便于 重用 ,把 partition 函数 的 定义 存放 在 目录 Utility 中 的 源 文件 partition. c 中 ,并 
将 该 函数 的 原型 声明 存储 为 partition. h。 

2) 链表 版 本 

对 于 组 织 成 链表 的 序列 ,将 PARTTION 过 程 实现 为 如 下 C 程序 。 


1 ListNode * listPartition(LinkedList * A,ListNode * p,ListNode * r){ 


2 ListNode * i, *j; 

3 void * x= (void * ) mallocC A->eleSize) ; 

4 memopy( (char * ) x, (char * )r->key, A->eleSize) ; / * x«a[r] * / 

5 i— p-»prev; 

6 for(j=p;j!=r;j=j->next) 

7 if A->comp( (char * )j->key, (char * )x)<=0){ / *a[j]&x* / 

8 i—i-»next; 

9 swap((char * )i->key, (char * )j->key, A-»eleSize) ; / * alilealj] * / 
10 ) 

11 free(x) ; 

12 swap((char * )i->next->key, (char * )r->key, A->eleSize) ; / * ali-1]ea[r] * / 
13 return i-»next; 


程序 3-5 实现 算法 3-2 的 C 函数 链表 版 本 的 定义 


对 程序 3-5 的 说 明 如 下 。 

CD 与 算法 过 程 一 样 ,函数 listPartition 有 3 个 参数 。 参 数 A 表示 序列 ALp. . r] FR 
po r 分 别 是 指向 序列 的 首 元 素 和 尾 元 素 的 指针 。 

(2) 与 程序 3-4 中 的 函数 partition 相 比 ,变量 ij 定义 成 了 指向 链表 结 点 的 指针 类 型 而 
非 表 示 数 组 下 标的 整 型 。 

CD 将 程序 3-4 中 所 有 对 数组 元 素 的 访问 替换 成 对 链表 结 点 的 访问 ,下 标的 自 增 换 成 
取 下 一 个 结 点 的 操作 ,就 形成 了 程序 3-5 中 相应 的 代码 。 

为 便于 重用 ,将 函数 listPartition 的 定义 代码 存储 为 utility 文件 夹 内 的 源 文件 
listpartition. c, 并 将 该 函数 的 原型 声明 存储 在 头 文件 listpartition. h 中 。 


3.2 分 治 算法 


很 多 有 用 的 算法 是 递归 结构 的 : 为 解决 一 个 给 定 的 问题 ,递归 地 调用 自身 一 次 或 多 次 
来 解决 关系 密切 的 若干 个 子 问题 。 这 样 的 算法 通常 遵循 分 治 方法 : 它们 将 问题 分 解 成 若干 


个 与 原 问 题 相仿 而 规模 较 小 的 子 问 题 , 递 归 地 解决 这 些 子 问题 ,然后 把 子 问题 的 解 合并 成 原 
问题 的 一 个 解 。 


分 治 范式 在 每 一 层 递归 包括 3 个 步骤 。 
(1) 分 解 : 将 问题 分 解 成 若干 个 子 问题 。 
(2) 治理 : 递归 地 解决 各 子 问 题 。 不 过 , 若 子 问题 的 规模 足够 小 ,就 以 直接 的 方式 (不 
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再 递归 ) 解 决 子 问题 。 
(3) 合并 : 将 子 问题 的 解 合并 成 原 问题 的 一 个 解 。 


3.2.1 归并 排序 算法 


1. 排序 问题 描述 


对 序列 进行 排序 是 很 多 应 用 问题 中 的 基本 操作 。 序 列 的 排序 问题 可 形式 化 地 表示 为 
如 下 。 

输入 : 表示 成 序列 的 全 序 集 <ai ,az ,… san > 

输出 : 输入 的 一 个 排列 ( 重 排 ) 二 a’ ay nas EIE a1 a; aL. 

序列 排序 问题 的 历史 十 分 悠久 ,人 们 用 各 种 各 样 的 策略 ,设计 出 了 种 种 解决 此 问题 

的 算法 。 相 信 很 多 读者 都 是 从 解决 骨 泡 排序 .插入 排序 等 问题 中 开始 程序 设计 学 习 的 。 本 
节 讨 论 两 个 用 分 治 策略 设计 的 排序 算法 ,其 中 之 一 就 是 归并 排序 算法 。 

2. 算法 的 伪 代 码 描 述 

归并 排序 是 一 个 典型 的 分 治 算法 : 将 序列 AD p. n 14r IK AD p. .gd 和 AL 十 1.. 门 ,分 别 
递归 地 对 这 两 个 子 序列 排序 ,将 得 到 的 排 好 序 的 子 序列 AD p. .qj 和 ALg 十 1. .rj 调用 在 前 面 
讨论 过 的 MERGE 过 程 合并 成 整个 有 序 序 列 AL p. .r]. E 3-3 示例 了 归并 排序 的 过 程 。 
排 好 序 的 序列 


Ze 


4 号 7 2 3 


2 6 
Jaa 


5 [47] [s DG 


2 
fon. FA JaA ra 
o 


E [E] B] B B [s 
初始 的 序列 
图 3-3 ”归并 排序 操作 


N 
N 


EJ 


图 3-3 所 示 为 对 数组 A 王 一 5,2,4,7,1,3,2,6 二 进行 的 归并 排序 操作 。 随 着 算法 自 底 
向 上 进行 , 排 好 序 的 序列 长 度 也 在 增加 。 
伪 代 码 描 述 如 下 : 


MERGE-SORT(A, pyr) 
lif p<r 
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2 then gL(ptr)/2 各 

3 MERGE-SORT(A, pq) 

4 MERGE-SORT (A,g+1,r) 
5 MERGE(A, p.q.7) 


算法 3-3 ”归并 排序 算法 MERGE-SORT 
3. 算法 的 运行 时 间 


运用 分 治 策略 的 算法 ,其 运行 时 间 往 往 表示 成 一 个 递归 方程 。 以 MERGE-SORT 过 程 为 
例 , 设 ALp. .J 中 及 个 元 素 , 设 对 AL p. . 门 进行 归并 排序 的 运行 时 间 为 T(z) 。 在 算法 3-3 
中 ,第 2 行 通过 一 个 赋值 操作 完成 对 问题 的 划分 , 耗 时 8(1)。 第 3 行 和 第 4 行 分 别 递归 调 
用 MERGE-SORT 过 程 自身 对 A[p..g] 和 A[g 十 1..r] 进 行 归并 排序 ,由 于 ALp.. q10 
Alq--1. . 门 各 含 n/2 个 元 素 , 所 以 这 两 行 耗 时 2T(n/2)。 第 5 行 调用 MERGE 过 程 将 有 序 
子 序列 ADp. .qj 和 ALg 十 1. .rj 合并 成 有 序 序列 A[Lp. . 门 。 根 据 本 章 3.1.1 节 ,第 5 行 耗 时 
O(n) ,于 是 得 到 : 

n=1 
icd m /2)+@n) n>] n 
n n n 

解 递归 方程 有 多 种 方法 ,此 处 介绍 常用 的 3 种 解法 。 

1) 递归 树 法 

用 递归 树 对 分 治 算法 的 运行 时 间 进 行 描述 特别 直观 。 在 一 棵 递归 树 中 ,每 一 个 结 点 表 
示 一 系列 递归 函数 调用 中 对 一 个 单一 子 问题 的 开销 。 把 树 的 每 个 层次 中 的 开销 相 加 得 到 各 
层次 的 开销 ,然后 再 把 各 层次 开销 相 加 来 确定 递归 树 的 所 有 层次 上 的 总 开销 。 

以 式 (3-1) 为 例 , 画 出 对 应 的 递归 树 , 如 图 3-4 所 示 。 


n 


Mo exti TES: 
n n/2 nl2 
SN SN Z/N 
Nn) Tnd) T(n/2?) Nn?) T2) NP) 
(a) (b) 
n "=n 
Lae te 
m2 m2 xdi 
rd Pd 
Ign n2? ni? nl? n? ---n 


i i od i 
1 1 L 1 1 
TD TD TA) 70:70) TD TD TO) === 
总 代价 : Ollga) 


| ZW ZY INS FS 


(c) 
图 3-4 MERGE-SORT 运动 时 间 的 递归 树 法 


O Lz 上 康 示 不 超过 z 的 最 大 整数 。 例 如 ,z=3. 54,Lz 173: i zx 一 一 3.54,Lz 上 一 4。[y 153 表示 不 小 于 y 的 最 小 
整数 。 例 如 ,y 一 3. 54,[y 4s m y= 一 3. 54,[y I2 —3. 
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图 3-4 所 示 为 递归 式 Ta) 二 2T(n/2) 十 cn? 的 递归 树 的 创建 。 图 3-4(a) 部 分 展示 了 
Tn), CER 3-4(b) 和 图 3-4(c) 部 分 中 逐渐 展开 ,形成 递归 树 。 图 3-4(c) 部 分 中 完全 展开 
的 树 的 高 度 为 lgz( 有 lgn 十 1 层 )。 

由 图 3-4 可 知 , 式 (3-1) 的 解 为 T(n) 二 8(nlgn)。 也 就 是 说 ,归并 排序 算法 最 坏 情形 运 
行 时 间 为 @(nlgn)。 

2) 迭代 法 

对 递归 方程 ,可 以 根据 其 定义 , 逐 层 先 代 直 至 递归 头 。 仍 以 式 (3-1) 为 例 ， 

T(n) = 2 T(/2) +n 
= 2(2T(n/2?) +n/2) +n = 2°T(n/2?) + 2n 
= 22(2T(z/23) +n/2?) + 2n = 2? T(n/25) +3n 


= 2" + nlgn 
= O(nlgn) 
与 上 述 递归 树 法 得 到 的 结果 是 一 样 的 。 
3) 定理 法 
对 形 如 式 (3-1) 这 样 的 递归 方程 ,可 以 利用 以 下 的 定理 解 它 。 
定理 3-1 Bab 是 非 负 常 数 ,n 是 c WE. 递归 方 程 
T(n) = » . die 
aT GQ/c) +O™) n1 


的 解 为 
O(n) acc 
T(n) = [pim a=c 
Omn) ac 


根据 此 定理 ,由 于 a=2,c=2,T09 一 | 


n=1 
AFERA Olgo)» 
2T(n/2) 十 O(n) n>1 P EREA Calen 


4. 程序 实现 


1) 数组 版 本 
利用 3.1.1 节 开 发 的 合并 操作 的 数组 版 本 的 merge 函数 ,把 算法 3-3 实现 为 以 下 C 函数 。 


1 # include 'merge. h" 

2 void mergeSort(void * a,int size,int p,int r,int( * comp) (void * ,void * )){ 
3 if(p<r)( 

int q=(p+r)/2; 

mergeSort(a, size: p»qscomp) ; 

mergeSort(a;size,q+1,r,comp); 


merge(a,size,p.q,r,comp) ; 


oonan e 


程序 3-6 ”实现 算法 3-3 的 MERGE-SORT if HAY C 函数 mergeSort 
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对 程序 3-6 的 说 明 如 下 。 

(1) mergeSort 函数 有 5 个 参数 : 其 中 ,a、p、r 对 应 于 MERGE-SORT 过 程 的 参数 A、p、 
ro TER a 的 类 型 是 void * ,这 意味 着 该 函数 能 对 任何 类 型 的 数组 做 归并 排序 操作 。 参 数 
size 确定 a 中 元 素 的 存储 长 度 , 参 数 comp 确定 a 中 元 素 大 小 比较 规则 。 

(2) C 语 言 中 整 型 数据 的 除法 运算 对 整数 是 封闭 的 ,所 以 对 正 整 数 a 和 b,a/b=La/b J, 
于 是 ,程序 中 的 第 4 行 a=(p 十 r)/2 对 应 于 算法 3-3 中 第 2 行 的 赋值 操作 gL(p 十 7)/2 上 

(D 程序 代码 与 算法 伪 代 码 十 分 近似 ,读者 可 对 照 研 读 。 

为 便于 重用 ,将 程序 3-6 中 的 代码 存储 在 utility 文件 夹 中 的 源 文件 mergesort. c 中 ,并 
将 此 函数 的 原型 声明 存储 在 头 文件 mergesort. h 中 。 

2) 链表 版 本 

利用 第 2 章 中 引入 的 链表 LinkedList 以 及 程序 3-2 中 的 合并 过 程 MERGE 的 链表 实现 
版 本 listMerge, 可 将 过 程 实现 为 如 下 链表 版 本 。 

1 void listMergeSort(LinkedList * A,ListNode * p,ListNode * r){ 

if(p! =r&.&p! — r-»next&.&.p-» prev! =r) ( 
int n=distance(p,r); 


ListNode * q=p; 


3 

4 

5 

6 q=advance(q,n/2); 
7 listMergeSort(A,p,q); 

8 listMergeSort( A q-»next.r) ; 
9 listMerge(A,p,qyr); 

10 } 


11} 
程序 3-7 实现 算法 3-3 的 C 函数 的 链表 版 本 listMergeSort 


对 程序 3-7 的 说 明 如 下 。 
CD 和 算法 过 程 一 样 ,函数 listMergeSort 有 3 FBR. SRA 表示 序列 A[p..r], 参 
数 pr 分别 是 指向 序列 的 首 元 素 和 尾 元 素 的 指针 。 
(2) 与 程序 3-6 中 函数 mergeSort 相 比 ,对 pr 的 判断 ,由 于 pr 不 再 是 表示 数组 元 素 的 
下 标 ,而 是 指向 结 点 的 指针 ,所 以 此 条 件 改变 为 pl==r && pl 二 r->next &8. p-»prev!—r. 
变量 q 定义 成 了 指向 链表 结 点 的 指针 类 型 而 非 表 示 数 组 下 标的 整 型 。 为 了 使 q 指向 pr 之 
间 的 中 点 , 先 调用 函数 distance, 计 算 p.r 之 间 的 结 点 数 n( 第 4 行 )。 该 函数 的 定义 很 简短 : 
int distance(ListNode * p,ListNode * r){ 
int dist=1; 
while(p! =r) { 
dist+ ++ 
p=p->next; 
} 


return dist; 


) 
为 便于 重用 ,将 此 函数 及 其 原型 声明 分 别 添 加 到 list. c 和 list. h 中 。 
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然后 , 令 q 从 p 开 始 (第 5 行 ), 调 用 函数 advance 让 q 往 后 行进 n/2 个 结 点 。 该 函数 的 
定义 也 很 简短 : 
ListNode * advance(ListNode *i,int d){ 
int distance=d>=0?d:-d,k=1; 
while(k<distance) ( 
i=(d>=0)?i->next: i->prev; 
k++; 
} 
return i; 


} 
它 将 传递 给 它 的 结 点 指针 参数 iE BE rh i BT Cd 00 Ee BH wk Mal Jes (Cd > 00 £e 3 | d| PHA. 
为 便于 重用 ,将 此 函数 及 其 原型 声明 分 别 添加 到 list. c Al list. h 中 。 

CD 将 程序 3-6 中 所 有 对 数组 元 素 的 访问 替换 成 对 链表 结 点 的 访问 ,下 标的 自 增 换 成 
取 下 一 个 结 点 的 操作 ,就 形成 了 程序 3-7 中 相应 的 代码 。 

为 便于 重用 ,将 函数 listPartition 的 定义 代码 存储 为 utility 文件 夹 内 的 源 文件 
listmergesort. c, 并 将 该 函数 的 原型 声明 存储 为 头 文件 listmergesort. h 中 。 


3.2.2 快速 排序 算法 


1. 算法 的 伪 代 码 描述 


快速 排序 也 是 一 个 典型 的 分 治 算法 : 和 归并 排序 一 样 ,将 ALp. .J] 划 分 成 A[p. .qj 和 
ALg 十 1..7J] 两 部 分 ,但 不 是 对 分 (g==L(p 十 r)/2 小 ,而 是 利用 3. 1. 2 节 中 的 PARTITION 
过 程 使 得 AL p. .gj 中 的 元 素 值 小 于 A[Lg 十 1..7] 中 的 元 素 值 。 递归 地 解决 Ap.. gd] 和 
A[d 十 1. . 门 后 就 可 省 略 合并 过 程 了 。 

QUICKSORT(A, pyr) 

lif p<r 

2 then q-- PARTITION(A, p,r) 

3 QUICKSORT(A, p,g—1) 

4 QUICKSORT(A .q3- 1.7) 


算法 3-4 快速 排序 算法 

2. 算法 的 运行 时 间 

仔细 考察 两 次 递归 所 处 理 的 子 问题 ,如 前 所 述 ALp..d] 和 ALo 十 1.. pj 的 规模 不 必 
相同 。 

最 好 情形 发 生 在 每 次 调用 PARTITION 过 程 总 是 将 AL p. . 门 分 成 两 个 长 度 相 同 的 子 序 
列 ALp. .qj 和 ALg 十 1. .Jj, 其 中 g 一 p 十 1==r 一 g。 此 时 ,两 次 递归 的 运行 时 间 为 2T(n/2)， 
每 次 划分 的 运行 时 间 为 G0 CHL 3.1.2 节 ), 这 样 将 得 到 一 个 与 归并 排序 运行 时 间 相 同 的 递 
归 方 程 : 
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T(n) = L unis 
2T(/2)4-8G)0 n1 
运用 定理 3-1 Al, QUICKSORT 的 最 好 情形 运行 时 间 为 (nlgn)。 
最 坏 情形 发 生 于 每 次 调用 PARTITION 过 程 总 是 将 A[p. . 门 分 成 AL 站 和 ALp 十 1.. r] 
(或 总 是 分 成 A[Lp..r 一 1] 和 A[r]) ,这样 将 得 到 一 个 递归 方程 : 
Tn) = T(n—1)+O(n) 
其 中 (nw) 表示 划分 时 间 ,T(n 一 1) 表 示 递 归 所 需 时 间 , 为 方便 计算 ,用 表示 OO) ,运用 递 
推 法 : 
T(n)= T(n—1)+n 
= T(n—2)+(n—1) +n 


=1+2+-"+@™m—D+n 
= n(n+1)/2 = GG?) 
得 到 该 方程 的 解 为 @(n?)。 

如 此 看 来 ,快速 排序 不 如 归并 排序 好 。 但 是 ,这 存在 着 一 个 微妙 之 处 : 快速 排序 的 平均 
情形 运行 时 间 更 接近 于 最 好 情形 时 间 。 例 如 ,假定 划分 算法 总 是 产生 9 : 1 比例 的 划分 ,这 
使 得 开始 时 看 起 来 划分 很 不 平衡 。 得 到 运行 时 间 的 递归 式 : 

TGD < T(9n/10) + T(n/10) + en 

其 中 已 经 显 式 地 表示 了 隐藏 在 9(z) 背 后 的 常数 因子 。 图 3-5 展示 了 此 递归 式 的 递归 树 。 
注意 树 的 每 一 层 具 有 代价 cn, 直至 遇 到 边界 条 件 深 度 logon = OC gn) ,此 后 各 层 的 代价 至 多 
为 cx。 递归 于 深度 logiosx 王 9(lgz) 处 终止 。 于 是 ,快速 排序 的 总 代价 为 O(nlgn)。 因 此 ， 
一 个 在 每 一 层 递归 都 按 9 :1 的 比例 进行 分 裂 ,初始 时 很 不 平衡 的 快速 排序 运行 于 
OCzlgz) 时 间 与 在 中 心 分 裂 的 渐 近 相同 。 事 实 上 ,甚至 是 99 : 1 的 比例 也 得 出 O(nlgn) 的 运 
行 时 间 。 原 因 是 按 任何 常数 比例 分 裂 都 导致 一 棵 深度 为 6(lgn) 的 树 ,而 每 一 层 的 代价 为 
O(Cz) 。 所 以 无 论 以 什么 比例 分 裂 运行 时 间 都 是 O(nlgn)。 更 精细 的 分 析 可 以 得 到 快速 排序 
的 平均 情形 运行 时 间 为 9(nlgn)。 

根据 对 快速 排序 的 这 一 观察 ,人 们 设法 控制 算法 的 行为 一 一 每 次 划分 随机 地 在 
ALp. .rj] 中 选取 一 个 元 素 作 为 划分 基准 ,以 此 来 获得 平均 情形 : 

RANDOMIZED-PARTITION(A,p,7) 

1 i<-RANDOM(p,7) 

2 exchange A[r]-^A[;] 

3 return PARTITION(A, p.r) 


算法 3-5 划分 算法 的 随机 版 本 
然后 在 排序 过 程 中 调用 RANDOMIZED-PARTITION Xf A[ p. . 门 进行 划分 。 
图 3-5 所 示 为 PARTITION 总 是 产生 9 : 1 的 分 裂 的 QUICKSORT 的 运行 时 间 递 归 树 ,得 
出 运行 时 间 为 9(Czlgz) 。 右 边 显示 的 是 每 一 层 的 代价 。 每 一 层 代 价 包 含 了 隐藏 于 O) A 
的 常数 c。 
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图 3-5 快速 排序 运行 时 间 递 归 树 


RANDOMIZED-QUICKSORT(A , p+) 


lif p<r 

2 then q-- RANDOMIZED-PARTITION(A , pr) 
3 RANDOMIZED-QUICKSORT( A , p q— 1) 
4 RANDOMIZED-QUICKSORT( A «q-- 1,7) 


算法 3-6 快速 排序 算法 的 随机 版 本 


以 此 来 获得 平均 运行 时 间 9(zlgz) 。 在 算法 中 人 为 地 使 用 随机 数 发 生 器 来 影响 算法 的 行为 
是 一 种 提高 算法 运行 效率 的 方法 ,使 用 这 种 方法 设计 的 算法 称 为 随机 算法 。 随 机 数 发 生 器 
在 大 多 数 高 级 程序 设计 语言 中 都 作为 库 函 数 提 供给 程序 员 使 用 ,在 C 语言 中 有 定义 在 
stdlib. h 中 的 库 函 数 rand() , 它 返 回 一 个 0 一 RAND_MAX 之 间 的 随机 数值 。 


3. 程序 实现 


首先 利用 3. 1. 2 节 中 的 partition 函数 实现 算法 3-7。 


1 int randomNumber(int p,int q){ 


2 return p+ (int) (Cdouble) (q— p) * rand()/(RAND_MAX)); 


4 int randmizedPartition(void * a,int size. int p,int r.int( * comp)(void * ,void * )){ 


3) 

5 int i= randomNumber( p. r) ; 

6 swap(atr * size,ati * size,size) ; 
T return partition(a, size: p»r,comp) ; 
8) 


/ * a[r]ea[i] * / 


程序 3-8 ”实现 算法 3-7 的 C 函数 的 数组 版 本 


对 程序 3-8 的 说 明 如 下 。 


COD 第 1 一 3 行 定义 的 函数 randomNumber 调用 库 函 数 rand() 计 算 介 于 两 个 参数 p、 
qd 之 间 的 一 个 随机 整数 ,并 将 其 返回 。 该 函数 代码 存储 为 utility 文件 夹 中 的 源 文件 rand- 


omn. C, 
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(2) 第 4 一 8 行 定 义 的 函数 randmizedPartition 实现 算法 3-5 中 的 RANDOMIZED- 
PARTITION 过 程 的 数组 版 本 。 程 序 代 码 与 伪 代 码 十 分 接近 。 将 这 个 函数 的 定义 添加 到 源 
文件 partition. c 中 ,并 将 它 的 原型 声明 添加 到 头 文件 parttion.h 中 。 

G) 实现 算法 3-5 中 的 RANDOMIZED-PARTITION 过 程 的 链表 版 本 如 下 : 


ListNode* rndListPartition(LinkedList * A,ListNode * p,ListNode * r){ 
int d 一 distance(p,r),t 一 randomNumber(0,d); 
ListNode * i=advance(p,t); 
swap(i->key,r->key, size) ; 


return listPartition(A,p,r); 


BF 3-9 实现 算法 3-5 的 C 函数 链表 版 本 


该 函数 先 计算 链表 中 结 点 p 到 结 点 r 之 间 所 含 结 点 的 个 数 ( 调 用 distance 函数 , 见 3. 2. 1 节 )d， 
产生 0 一 4 之 间 的 随机 数 t, 找 到 链表 中 从 p 起 的 第 + 个 结 点 (调用 advance 函数 , 见 3. 2.1 Wis 
交换 结 点 i、r 后 调用 listPartition 对 从 p 到 r 进行 划分 操作 。 

将 这 个 函数 的 定义 添加 到 源 文 件 listpartition. c 中 ,并 将 它们 的 原型 声明 添加 在 头 文件 
listpartition. h 中 。 做 好 这 些 准 备 工作 后 ,实现 算法 3-6 中 过 程 RANDOMIZED-QUICKSORT。 

1 void quickSort(void * a,int size,long p,long r,int( * comp)(void * ,void * )){ 

if(p<r){ 
long q= randmizedPartition(a, size, p,r,comp) ; 


2 

3 

4 quickSort(a, size, p«q— 1, comp) ; 
5 quickSort(a.size«q-- 1, r. comp) s 
6 


") 
8 void listQuickSort(LinkedList * A,ListNode * p,ListNode * r)( 
9 if(p!=r){ 


10 ListNode * q=rndListPartition(A,p,r); 
11 listQuickSort(A,p,q!=p?q->prev:p); 
12 listQuickSort(A.q! — r?q-»next:r.r) ; 
13 ) 

14 } 


程序 3-10 实现 算法 3-6 的 C 源 代码 


对 程序 3-10 的 说 明 如 下 。 

COD 第 1 一 7 行 定义 的 函数 quickSort 是 实现 算法 3-6 的 数组 版 本 , 它 含有 5 个 参数 。 其 
中 ,a 表示 数组 ,size 表示 数组 中 元 素 的 存储 宽度 ,p、r 为 数组 a 的 首 、 尾 元 素 下 标 ,comp 表 
示 数 组 a 中 元 素 之 间 大 小 比较 规则 。 程 序 代码 与 伪 代 码 十 分 接近 。 将 这 个 函数 的 定义 存储 
为 utility 文件 夹 中 的 源 文 件 quicksort. ec, 并 且 将 它们 的 原型 声明 存储 为 头 文件 quicksort. h, 
以 备 重用 。 

(2) 第 8 一 14 行 定义 的 函数 listQuickSort 是 实现 算法 3-6 的 链表 版 本 , 它 含 有 3 个 参 
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数 。 其 中 ,A 表示 序列 ALp. . rj,p、r 为 指向 链表 中 带 排序 部 分 的 首 、 尾 结 点 指针 。 

(3) 算法 中 以 p<r 来 判断 aLpj、aLrj 之 间 是 否 存 在 多 于 1 个 的 元 素 。 由 于 此 处 pyr A 
再 是 表示 数组 元 素 的 下 标 , 而 是 指向 结 点 的 指针 ,所 以 此 条 件 需 改 变 为 p! =r, i qw 
定义 成 了 指向 链表 结 点 的 指针 类 型 而 非 表 示 数 组 下 标的 整 型 ,对 第 10 行 计算 出 来 的 q, 若 
q 一 一 p, 则 对 左 半 部 分 的 递归 传递 的 第 3 个 参数 就 是 pb, 和 否则 传递 q-> next。 类 似 地 , 若 
q 一 一 上 , 则 对 右 半 部 分 的 递归 第 3 个 参数 传递 ,否则 传递 q->prev。 将 这 个 函数 的 定义 存 
储 为 utility 文件 夹 中 的 源 文件 listquicksort. c, 并 且 将 它们 的 原型 声明 存储 为 头 文件 


listquicksort. h, 
3.2.3 序 统计 与 选择 问题 


1. 问题 的 描述 


nn 个 元 素 集合 的 第 i 个 序 统计 是 第 i 小 元 素 。 例 如 ,集合 的 最 小 元 素 就 是 第 一 序 统计 
G=1) ,而 最 大 元 素 就 是 第 n 序 统 计 (i 二 n)。 中 值 ,也 就 是 集合 的 “中 途 点 ”"。 当 为 奇数 
时 ,中 值 是 唯一 的 ,发 生 在 i= (x 十 1)/2 处 。 而 当 是 偶数 时 ,有 两 个 中 值 ,发 生 在 i=n/2 
和 i 二 n/2 十 1 处 。 于 是 ,不 管 的 奇偶 性 ,中 值 总 是 发 生 在 i 二 Ln 十 1)/2 上 低 中 值 ) 处 和 i 二 
LQ 十 1)/2 【高 中 值 ) 处 。 为 方便 计 , 词 语 * 中 值 指 的 是 低 中 值 。 

此 处 研究 从 个 互 不 相同 数 的 集合 中 选取 第 i 序 统计 的 问题 , 即 选择 问题 。 尽 管 所 做 
的 工作 都 可 以 扩展 到 集合 中 有 重复 元 素 的 情形 ,为 方便 计 仍然 假定 集合 中 的 数 各 不 相同 , 且 
约定 用 线性 表 表示 集合 A。 选 择 问题 可 以 形式 化 地 说 明 如 下 。 

输入 : 线性 表 AD p. .rj 中 (n= 二 p 一 7) 个 (各 不 相同 ) 的 元 素 AD p. . 门 以 及 满足 Sin 
WEEE 

输出 : 元 素 zE A[p..r] Ette ALp..r] PA Ah i—1 个 元 素 大 。 

选择 问题 可 以 在 O(nlgn) 时 间 内 解决 ,因为 可 以 用 归并 排序 将 各 数 排序 然后 直接 指出 
输出 数组 中 的 第 i 个 元 素 , 然 而 却 有 更 快 的 算法 。 


2. 算法 的 伪 代 码 描 述 


解决 选择 问题 的 一 个 算法 类 似 快 速 排序 算法 的 思想 ,为 了 在 序列 A p. .J 中 找 出 第 i 
小 的 元 素 , 先 调用 RANDOMIZED-PARTITION 过 程 将 A 划分 成 A[p..gj 和 A[Lg 十 1..7j, 使 
得 A[p. .qj 中 的 元 素 值 不 超过 A[g],A[o 十 1. . 门 中 的 元 素 值 大 于 AL]. # 一 0 一 2 十 1, 则 
ALqj 即 为 所 求 ;车 i<g 一 p 十 1, 则 问题 转化 为 在 Ap. .gq 一 1] 中 找 第 i 小 元 素 ; 若 i>q 一 p 十 1， 
则 问题 转化 为 在 ALg 十 1. .J 中 找 第 i 一 gq 十 p 一 1 小 元 素 。 

SELECT(A, p. r.i) 

lifp—r 

2 then return A[ p] 

3 q*-RANDOMIZED-PARTITION(A, pr) 

4 k-q—p41 

5 if i=k 上 > 基准 元 素 即 为 答案 

6 then return A[q] 
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7 else if i<k 


8 
9 


3; 


then return SELECT(A, p,q—1,i) 
else return SELECT(A,g+1,r,i—k) 


算法 3-7 解决 选择 问题 的 SELECT 算法 过 程 
算法 的 运行 时 间 


与 快速 排序 算法 的 分 析 相 似 ,此 过 程 最 坏 情形 发 生 在 每 次 划分 都 得 到 序列 的 前 端 或 末 
端 ,运行 时 间 为 (nn) = 二 Tl(n 一 1) 十 nxn。 利用 办 代 法 ,很 容易 计算 出 T(n) 二 8(m*)。 最 好 情形 
发 生 在 每 次 划分 都 得 到 中 点 ,与 快速 排序 不 同 的 是 ,此 处 只 需要 处 理 两 个 子 序列 之 一 ,所 以 
运行 时 间 为 TCD) 三 TOz/2) 十 2 根据 本 章 定理 3-1 可 知 ,T(z) 王 9(z)。 平 均 情 形 时 间 也 与 
快速 排序 算法 相似 ,与 最 好 情形 运行 时 间 相同 ,为 8(n)。 


4. 


程序 实现 


利用 程序 3-8 和 程序 3-9 定义 的 函数 randmizedPartition 和 rndListPartition ,可 实现 如 
下 的 SELECT 算法 的 数组 版 本 和 链表 版 本 。 


1 void * select(void * a,int size. int p,int r.int i,int( * comp) (void * ,void * )){ 


€ 0 - Oo Oc & Q t 


10 
11 
12 ) 


int q.k; 
if(p= =r) 

return (char * )a+p * size; /* 返 回 a[p]*/ 
q=randmizedPartition(a, size, p, r, comp) ; 
k—q—p: 
if(k= =i) 

return (char * )a+q * size; / * BM a[q] * / 
ifG<k) 


return select(a,size,p,q—1,i,comp) ; 


return select(a,size,q+1,r,i—k—1,comp); 


13 ListNode * listSelect(LinkedList * a,ListNode * p,ListNode * r,int i) { 


14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 } 


ListNode * q; 
int k; 
if(p==n 
return p; 
q=rndListPartition(a,p,r) ; 
k=distance(p,q)-1; 
if(k= =i) 
return q; 
ifG<k) 
return listSelect(a,p,q!=p?q->prev: psi); 
return listSelect(a,q! —r?q-»next:r,r,i— k— 1); 


程序 3-11 实现 算法 3-7 的 C 函数 
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对 程序 3-11 的 说 明 如 下 。 

CD 第 1 一 12 行 定 义 的 是 实现 算法 3-7 的 数组 版 本 函数 select。 与 算法 过 程 相 比 ,参数 
除了 表示 数组 的 a ,起 点 p、 终 点 和 序号 1i 以 外 ,还 多 了 表示 数组 元 素 存储 宽度 的 size 和 比 
较 元 素 大 小 的 函数 指针 参数 comp。 这 是 因为 实现 的 是 利用 void * 的 通用 代码 。 

(2) 伪 代 码 中 序 统计 操作 中 ,序号 从 1 开始 ,符合 其 数组 下 标的 编排 规则 。 在 C 语言 
中 ,数组 的 下 标 是 从 0 开始 编排 的 。 为 不 减弱 代码 的 可 读 性 ,序号 也 从 0 开始 编排 。 这 样 就 
需要 对 程序 中 表示 p、q 间 包 含 的 元 素 个 数 的 k 做 相应 的 调整 。 把 此 函数 的 定义 及 其 原型 声 
明 分 别 存储 为 utility 文件 夹 内 的 源 文件 select. c 和 头 文件 select. h, 以 备 重用 。 

(3) 第 13 一 25 行 定义 的 是 实现 算法 3-7 的 链表 版 本 函数 listSelect。 该 函数 的 参数 与 
算法 过 程 参 数 是 一 致 的 。 这 是 因为 已 经 把 链表 中 元 素 的 存储 宽度 和 元 素 间 的 比较 规则 都 已 
经 封装 在 了 链表 内 ( 见 2.1.3 节 )。 把 此 函数 的 定义 及 其 原型 声明 分 别 存储 为 utility 文件 夹 
内 的 源 文件 listselect. c 和 头 文件 listselect. h, 


3.3 排序 问题 的 讨论 


3.3.1 排序 的 性 质 


1. 就 地 排序 


在 排序 过 程 中 ,任何 时 刻 至 多 有 常数 个 元 素 存 储 于 序列 之 外 , 则 排序 过 程 称 为 就 地 排序 
过 程 。 按 此 概念 ,快速 排序 是 就 地 排序 过 程 ,这 是 因为 ,在 QUICK-SORT 的 运行 过 程 中 , 任 
何 时 刻 , 序 列 中 仅 有 最 后 一 个 元 素 A[r] 存 储 于 序列 之 外 的 变量 xz 中 。 而 归并 排序 算法 不 是 
就 地 排序 过 程 ,因为 ,在 MERGE-SORT 的 运行 过 程 中 ,每 一 层次 的 递归 都 需要 调用 MERGE 
过 程 。MERGE 过 程 中 ,需要 设置 辅助 序列 工 和 尺 ,它们 需要 占据 8(n) 的 空间 ,其 中 表示 
序列 所 含 元 素 个 数 。 


2. 稳定 性 


在 排序 过 程 中 ,如 果 具 有 相同 值 的 元 素 在 输出 数组 中 的 顺序 与 其 在 输入 数组 中 的 相同 ， 
则 该 算法 称 为 是 稳定 的 。 按 此 概念 ,研究 所 讨论 过 的 插入 排序 ,归并 排序 ,快速 排序 和 堆 排 
序 算 法 不 难 作出 如 下 断言 。 

定理 3-2 归并 排序 是 稳定 排序 ,而 快速 排序 不 是 稳定 排序 。 

在 归并 排序 算法 3-3 中 ,对 两 个 子 序 列 递 归 后 需要 调用 算法 3-1 的 MERGE 过 程 加 以 合 
JF. TE MERGE 过 程 中 , 仅 当 工 [可 >RL 门 时 ,在 原 序列 中 后 面 的 元 素 R[ 门 才 会 发 生 位 置 前 
移 到 原 序列 中 前 面 的 元 素 L[ 门 之 前 的 变化 。 所 以 ,数值 相同 的 元 素 之 间 不 会 发 生 位 置 的 相 
对 变化 。 根 据 稳定 性 概念 可 知 归并 排序 算法 是 稳定 的 。 对 于 快速 排序 ,只 要 考察 划分 算法 
就 可 知道 它 不 是 稳定 的 。 例 如 ,对 图 3-6(a) 的 序列 进行 PARTITION 操作 得 到 图 3-6(b) 的 序 
列 。 注 意 原 来 位 于 7 后 面 的 元 素 7' 换 位 到 了 它 的 前 面 。 

在 一 些 应 用 中 ,排序 的 稳定 性 是 很 重要 的 。 例 如 , 当 排 序 条 件 包含 两 个 关键 字 时 ,往往 
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PARTITION 
> 


(a) (b) 
3-6 PARTITION 过 程 的 不 稳定 性 


要 求 在 第 一 个 关键 字 相等 的 情况 下 ,要 计算 第 二 个 关键 字 的 某 种 比较 关系 ,这 就 需要 对 第 一 
个 关键 字 排 序 是 稳定 的 。 


3.3.2 比较 型 排序 算法 的 时 间 复 杂 度 


前 面 讨论 了 解决 排序 问题 的 两 种 排序 算法 : 归并 排序 和 快速 排序 。 这 两 个 算法 有 一 个 
共同 的 特性 : 排序 顺序 的 确定 仅 基于 序列 中 元 素 间 的 比较 ,将 这 些 排序 算法 称 为 比较 排序 。 


1. 决策 树 


比较 排序 可 以 抽象 地 视 为 一 棵 决策 树 。 一 棵 决策 树 是 一 棵 满 二 叉 树 0, 它 表示 了 一 个 
具体 排序 算法 对 给 定 规 模 输 入 的 操作 时 各 元 素 之 间 的 比较 。 算 法 中 的 控制 .数据 移动 和 其 
他 所 有 的 方面 都 被 忽略 。 为 使 行为 简洁 ,就 下 列 简 单 的 插入 排序 算法 展开 讨论 。 


INSERTION-SORT (A) 
1 for j<-2 to length[ A] 
2 dokey--ALj] 
3 bt A[ 门 插入 到 排 好 序 的 序列 A[1..j 一 1] 中 
4 i—j-l 
5 while i>0 and A[i]>key 
6 do ALi-1]--ALi] 
7 isi-1 
8 Alitl]<+key 
算法 3-8 ”解决 排序 问题 的 INSERTION-SORT 算法 


图 3-7 展示 了 插入 算法 对 一 个 三 元 素 的 输入 序列 的 操作 。 


G2) 


图 3-7 对 3 个 元 素 进行 插入 排 序 的 决策 树 


图 3-7 所 示 为 对 3 个 元 素 进 行 插入 排序 的 决策 树 。 标 注 为 i: j 的 内 结 点 指出 a; Hla; 


O 满 二 叉 树 指 的 是 具有 下 述 性 质 的 二 叉 树 : 树 中 的 每 个 内 点 都 具有 两 个 孩子 。 
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之 间 的 一 次 比较 。 由 排列 二 x(1) ,x(2),…,r(Gz) 过 表示 的 一 片 叶 子 指示 出 一 个 排序 arao < 
ana E aso) 。 阴 影 路 径 指示 出 对 输入 序列 <a 一 6,a 一 8,as 王 5 二 排序 所 做 的 决策 ; 叶 
子 处 的 排列 二 3,1,2 二 指示 出 排 好 序 的 顺序 为 :=5,a 一 6,a 一 8。 输 入 元 素 共 有 31—6 种 
可 能 的 排列 ,所 以 决策 树 中 共有 6 片 叶子 。 

在 一 棵 决策 树 中 ,每 一 个 内 点 都 标注 为 i: j, 其 中 i 和 j 取 自 范围 Si. jn ih n 是 输 
和 人 序列 中 数 的 个 数 。 每 一 片 叶子 用 一 个 排列 二 x(1) ,x(2),…,x(n) 记 加 以 标注 。 排 序 算法 
的 执行 对 应 于 决策 树 中 一 条 从 根 到 一 片 叶子 的 路 径 。 在 每 一 个 内 点 处 做 一 次 比较 。 左 子 树 
指示 出 aia; 后 来 的 比较 , 右 子 树 指示 出 ww >a; 后 来 的 比较 。 当 来 到 一 片 叶 子 时 ,排序 算 
法 已 经 完成 了 排序 aro ass axo。 由 于 任 一 正确 的 排序 算法 必 能 产生 其 输入 序列 的 每 一 
个 排列 ,比较 排序 正确 的 必要 条 件 是 m 个 元 素 的 n! 个 排列 中 的 每 一 个 必须 作为 一 片 叶子 
出 现在 决策 树 中 ,并 且 从 根 起 到 这 些 叶 子 中 的 每 一 片 都 有 一 条 对 应 于 该 比较 排序 的 一 次 确 
切 的 执行 的 路 径 (将 这 样 的 叶子 称 为 从 根 * 可 达 ” 的 )。 于 是 ,将 仅 考虑 每 个 排列 都 显示 为 可 
达 叶 子 的 决策 树 。 

从 决策 树 的 根 起 ,到 其 任意 一 片 可 达 的 叶子 的 最 长 路 径 的 长 度 表 示 了 对 应 的 排序 算法 
的 最 坏 情形 所 执行 的 比较 次 数 。 因 此 ,对 于 给 定 的 排序 算法 最 坏 情形 的 比较 次 数 等 于 其 决 
策 树 的 高 度 , 输 入 的 每 一 个 排列 作为 决策 树 中 的 一 片 可 达 叶 子 。 所 有 决策 树 的 高 度 的 下 界 
就 是 任 一 比较 排序 算法 运行 时 间 的 下 界 。 由 于 高 度 为 h 的 二 叉 树 至 多 有 2* 片 叶 子 , 所 以 对 
Hn! 片 可 达 叶 子 的 满 二 又 树 而 言 ,有 n 12^ I AR Sgn!) Salen. 于 
是 可 得 到 如 下 定理 。 

定理 3-3. 任 一 比较 排序 算法 在 最 坏 情 形 下 至 少 需要 做 nlgn 次 比较 。 

这 意味 着 任何 一 种 比较 型 的 排序 算法 ,其 时 间 复 杂 度 至 少 是 nlgn。 由 此 可 见 , 理 论 上 
归并 排序 是 最 优 的 排序 算法 ,因为 它们 在 最 坏 情 形 下 的 运行 时 间 是 OCrl gn) 。 


2. 计数 排序 


若 排序 过 程 中 ,决定 元 素 前 后 排列 位 置 并 不 基于 元 素 间 的 大 小 比较 , 则 算法 的 最 坏 情 形 
运行 时 间 的 下 限 不 受 定理 3-2 的 约束 。 例 如 ,下 列 讨论 的 计数 排序 算法 就 是 一 个 典型 的 不 
是 基于 比较 的 排序 算法 。 

1) 算法 描述 与 分 析 

计数 排序 假设 ”个 输入 元 素 的 每 一 个 是 0 到 中 的 一 个 整数 ,其 中 & 为 一 个 整数 。 当 
k 二 On) 时 ,排序 时 间 为 Or). 

计数 排序 的 基本 思想 是 对 每 一 个 输入 元 素 x 确定 比 x 小 的 元 素 个 数 。 这 一 信息 可 以 
用 来 将 工 直接 置 于 其 在 输出 数组 中 的 位 置 。 例 如 , 若 有 17 个 元 素 小 于 xz, 则 zz 应 在 输出 数 
组 的 第 18 个 位 置 上 。 这 一 方案 在 有 若干 个 元 素 具 有 相同 值 时 ,要 做 一 点 修改 ,因为 不 想 把 
它们 放 在 一 个 位 置 上 。 

在 计数 排序 的 代码 中 ,假设 输入 是 一 个 数组 AL1. .nj, 且 其 长 度 Pength[ A] =n. BiG 
要 两 个 数组 : 数组 BOL. .站 存储 排 好 序 的 输出 ,数组 CCo. .kj 提供 一 个 临时 工作 空间 。 


O ”根据 斯 特 林 公式 tm Van (7-) (1+ (二 ) ) ,到 对 数 可 得 。 
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12345678 12345678 
a ELB PEB DE 6d 234 B 
012345 c[2T214[zT7[s 012345 
c[2]o[2]3To[1 c BARRARE 

(a) (b) (c) 
12345678 12345678 
5 ol DIS BA 123456758 
0122345 0122345 5 [e[o[2 2[s]3 [3]5 
cLlzlalel7ls clzTslsT7Ts] 

(d) (e) (b 

图 3-8 计数 排序 


图 3-8 所 示 为 COUNTING-SORT 对 数组 ALL. .8] 的 操作 ,其 中 A 的 每 个 元 素 都 是 不 超 
过 k= 二 5 的 非 负 整数 。 图 3-8(a) 为 数组 A 和 第 4 行 后 的 数组 C。 图 3-8(b) 为 第 7 行 后 的 数 
组 C。 图 3-8(c) 一 图 3-8(e) 为 输出 数组 忠和 分 别 为 第 9 一 11 行 的 循环 的 第 一 、 二 ,三 次 重复 后 
的 辅助 数组 C。 数 组 B 中 仅 浅 阴影 元 素 才 是 被 填 人 的 。 图 3-8(f) 为 最 后 排 好 序 的 数组 B 

COUNTING-SORT(A , Bk) 

1 for i<-0 tok 

2 do Clil+o 

3 for j<-1 to length[A] 

4 do C[AL;]]--CLAL;]] 1 

5 PC] T CT LOC E 

6 for ix-1 tok 

7 do Cli]+Cli]+Cli-1] 

8 DCL] 包含 了 小 于 或 等 于 i 的 元 素 个 数 

9 for j<-lengthLA] downto 1 

10 do BLCLAL/]]]--AU] 

11 CLALj1]- CLAL;1]71 

算法 3-9 计数 排序 过 程 COUNTING-SORT 


计数 排序 过 程 如 下 。 在 第 1 行 和 第 2 行 的 for 循环 做 了 初始 化 后 ,在 第 3 行 和 第 4 行 的 
for 循环 中 检测 每 一 个 输入 元 素 。 若 一 个 输入 元 素 的 值 是 i 增加 C[ 门 。 于 是 ,第 4 行 后 ,对 
i 二 0,1,…,k,C[ 引 存储 了 等 于 i 的 输入 元 素 个 数 。 在 第 6 行 和 第 7 行 ,对 每 一 个 ;一 0， 
1,…,k, 通 过 求 数组 C. 的 相 邻 项 的 和 来 确定 有 多 少 个 元 素 小 于 或 等 于 i。 

最 后 ,在 第 9 行 和 第 11 行 的 for 循环 中 ,将 元 素 AD; TELA (E Ss i CAR. B 中 的 正确 的 
排序 位 置 。 车 所 有 的 个 元 素 是 各 不 相同 的 , 则 当 首 次 进入 第 9 行 时 ,对 每 一 个 A[ 站 ], 值 
CLA[j]] 就 是 A[j] 在 输出 数组 B 中 的 位 置 。 由 于 各 元 素 不 必 不 同 ,每 次 把 AD; TELA ICH 
B 后 从 CLA[L;]] 中 减 值 。 对 CLAL;]] 的 减 值 使 得 下 一 个 其 值 等 于 A[j] 的 元 素 可 直接 到 达 
输出 数组 中 A[ 站 前 的 位 置 。 

计数 排序 需要 多 少时 间 呢 ? 第 1 行 和 第 2 行 的 for 循环 耗 时 GGO ,第 3 行 和 第 4 行 的 
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for 循环 耗 时 O(n) ,第 6 行 和 第 7 行 的 for 循环 耗 时 OCA) ,而 第 9 一 11 行 的 for FAMFENT OC) 。 
于 是 ,总 耗 时 B@(& 十 n) 。 实 践 中 , 当 k 二 OQ) 时 , 常 使 用 计数 排序 ,此 时 的 运行 时 间 是 OG) 。 

计数 排序 突破 了 定理 3-2 的 nlgn 下 界 , 这 是 因为 它 不 是 比较 排序 。 事 实 上 ,在 代码 中 
没有 发 生 任 何 元 素 间 的 比较 。 计 数 排序 是 用 元 素 的 确切 值 来 将 元 素 编 入 一 个 数组 的 。 不 是 
比较 排序 模型 就 不 能 应 用 QCnlgn) 的 排序 下 界 。 计 数 排序 是 稳定 的 ,但 不 是 就 地 排序 。 

2) 程序 实现 

1 #include 一 stdlib. h> 


2 void countSort(unsigned * a,int n) ( 
3 unsigned * b= (unsigned * ) malloc( (n) * sizeof(unsigned)), * c. k—a[0]; 


4 int i; 

5 for(i-l1;i niic d) /* 找 出 a 中 最 大 值 k*/ 

6 if(aliJ>k) 

7 k=a[i]; 

8 c= (unsigned * )malloc((k 十 1) * sizeof(unsigned) ) ; 

9  for(i-0;ic —k;iidt- 4) /* 数 组 c 清 Ox/ 

10 c[i]—0; 

ll forG=0;i<n;i ++) /* c[ 门 包含 了 等 于 i 的 元 素 个 数 */ 
12 cLaliJJ++; 

13 forG=1;i<=k;i++) /* ci] 包含 了 小 于 或 等 于 i 的 元 素 个 数 */ 
14 eLiJ=cli—1]+cLils 

15 for(i=n—1;i>—1;i-—){ 


16 b(cLali]J—1]=alil; 

17 eLaliJ]——; 

18 } 

19 memcpy(a,b,n* sizeof(unsigned) ) ; 
20 free(b);free(c); 


程序 3-12 实现 算法 3-9 的 C 源 代码 


对 程序 3-12 的 说 明 如 下 。 

(1) 函数 countSort 有 2 个 参数 ,a 为 待 排序 的 数组 ,n 指出 a 中 所 具有 的 元 素 个 数 。 

(2) 第 3 行为 数组 b 分配 n 个 存储 单元 ,用 来 存放 对 a 排序 的 结果 。 算 法 3-9 中 的 C 是 
一 个 长 度 足 够 大 的 数组 ,要 能 包含 A 中 最 大 值 作为 下 标的 元 素 。 为 了 合理 地 分 配 空间 ， 
第 5 一 7 行 计算 数组 a 中 的 最 大 值 ,记录 在 变量 k 中 。 第 8 行为 数组 c 分 配 k 个 存储 单元 。 

G) 第 8 一 18 行 并 排 的 4 个 for 循环 实现 算法 3-9 中 对 应 的 4 个 for 循环 。 程 序 代 码 与 
伪 代 码 十 分 接近 。 第 19 行将 排序 结果 b 复制 到 a 中 ,以 符合 实用 中 对 数组 a 的 排序 结果 仍 
然 在 a 中 的 习惯 。 

为 便于 重用 ,将 程序 3-9 存储 为 utility 文件 夹 中 的 源 文件 countsort. c, 并 将 该 函数 的 原 
型 声明 存储 为 头 文件 countsort. h。 


3.3.3 应 用 


排序 算法 有 广泛 的 应 用 。 在 第 1 章 就 看 到 过 ,数据 经 过 排序 后 ,利用 二 分 查找 法 查找 指 
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定数 据 项 要 比 普通 线性 查找 效率 高 得 多 。 以 后 会 看 到 ,很 多 解决 经 典 问题 的 算法 都 要 对 数 
据 进 行 包含 排序 在 内 的 预 处 理 。 解 决 下 列 的 环 法 自行 车 游 问 题 就 需要 用 到 排序 。 


1. 环 法 自行 车 游 
Tour De France 


Description 

A racing bicycle is driven by a chain connecting two sprockets. Sprockets are grouped 
into two clusters: the front cluster (typically consisting of 2 or 3 sprockets) and the rear 
cluster (typically consisting of between 5 and 10 sprockets). At any time the chain 
connects one of the front sprockets to one of the rear sprockets. The drive ratio—the ratio 
of the angular velocity of the pedals to that of the wheels—is n + m where n is the number 
of teeth on the rear sprocket and m is the number of teeth on the front sprocket. Two 
drive ratios d; <d; are adjacent if there is no other drive ratio di <d; <d. The spread 
between a pair of drive ratios d; — d; is their quotient: d»/d;. You are to compute the 
maximum spread between two adjacent drive ratios achieved by a particular pair of front 
and rear clusters. You may assume that no cluster has more than 10 sprockets and that no 
gear has fewer than 10 or more than 100 teeth. 

Input 

Input consists of several test cases, followed by a line containing 0. Each test case is 
specified by the following input. 

* f: the number of sprockets in the front cluster. 

e r; the number of sprockets in the rear cluster. 

* f integers.each giving the number of teeth on one of the gears in the front cluster. 

* r integers.each giving the number of teeth on one of the gears in the rear cluster. 

Output 

For each test case,output the maximum spread rounded to two decimal places. 

Sample Input 

24 

40 50 


12 14 16 19 
0 


Sample Output 
1.19 


D) 问题 描述 与 分 析 

自行 车 的 驱动 系统 包含 很 多 齿轮 。 齿 轮 通常 分 成 两 组 : 前 端 齿轮 和 后 端 齿轮 。 自 行车 
就 是 通过 连接 一 个 前 端 齿 轮 和 一 个 后 端 齿 轮 来 驱动 的 。 设 有 /个 前 端 齿轮 ,r 个 后 端 齿 轮 ， 
每 个 前 端 齿 轮 i 有 mm[ 疏 个 齿 ,i 二 1,2,…,f。 每 个 后 端 齿轮 7 有 n[jj 个 上 从 ,j= 二 1,2,…,r。 所 
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以 共有 fe -个 可 能 的 驱动 率 d[LA] 王 对门 : ma[ 相 ,一 1.2，……r。 太 JJ) 一 1,2 or i=1,25°° fe 


假定 


d HER ROR BN d 中 两 个 相 邻 元 素 满足 题 中 若 di <d, 不 存在 ds 使 得 dı <d; <d: 


的 条 件 。 由 此 ,可 计算 出 spread[1.. f 7 一 菇 数组 : spread[& ] —d[&- 1]/d[& ]-&—1. 


2, 


sre /一 1。 所 以 ,本 问题 可 以 形式 化 如 下 。 

输入 : KH mOl.. f£]... r]. 

输出 : 根据 数组 m 和 计算 出 来 的 spread[1..f，r 一 1] 数 组 中 的 最 大 值 。 
2) 算法 描述 


TOUR-DE-FRANCE(m,n) 
1 f<lengthLm] 

2 r--length[n] 

3 ke1 

4 for j--1 tor 

5 do for ix-1 to f 


6 do d[ & ]-7[j ]/mLi] 
1 kekt+1 
8 SoRT(d) 


9 for &—1 to r f—1 
10 do spread[k]<-d[k+1]/d[Lk] 
11 return SELECT(spread,r* f—1) 


算法 3-10 解决 Tour De France 问题 的 算法 过 程 
其 中 ,过 程 SELECTA por. Ab 3.2.3 节 中 描述 的 选择 序列 A[ p. .7] 中 第 i 小 元 素 的 


算法 3-7。 


3) 程序 实现 
为 节省 篇 幅 , 此 处 仅 列 出 实现 算法 3-10 的 tourDeFrance 函数 ,调用 此 函数 解决 Tour 


De France 问题 的 主 调 函 数 与 tourDeFrance 函数 一 起 存储 在 文件 夹 chap03/Tour De 
France 的 源 文件 tourdefrance. c 中 ,读者 可 打开 该 文件 研读 。 
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1 double tourDeFrance(int * m,int * n,int f,int r){ 


2 double * d= (double * )malloc({ * r * sizeof double) . / * 为 数组 d 分 配 空 间 * / 

3  *spread— (double * )malloc(Cf * r—1) * sizeof(double))， / * 为 数组 spread 分 配 空间 * / 
4 results / * 用 来 存放 计算 结果 * / 

5 inti,j,k—0; 

6 assert(d&.&spread) ; 

7 for(j-0;j& rit 32 / * SCR ds / 

8 for(i=0;i<f;i++) 

9 d[k-- + ]= (double) n[ j /m[i]: 

10  quickSort(d,sizeof( double) ,0, f * r—1,doubleGreater) ; / * 对 数组 d 按 升序 排序 * / 
11 for(k=0;k<f* r—1;k++) / * it ABA spread * / 

12 spread[ k] — dL k--1]/d[k]; 

13 free(d); 


14  result— * ( (double * )select(spread.sizeof( double) .0.f * r— 2, 
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fx r 一 2,doubleGreater)); / * 在 数组 spread 中 选择 最 大 者 作为 计算 结果 * / 
15 free(spread) ; 
16 return result; 


17} 


程序 3-13 ”实现 算法 3-10 的 C 源 代码 


对 程序 3-13 的 说 明 如 下 。 

(1) 函数 tourDeFrance 有 4 个 参数 ,m、n 表示 数组 。 由 于 C 语言 的 数组 没有 长 度 属 
性 ,所 以 参数 fr 分别 表示 这 两 个 数组 的 元 素 个 数 。 该 函数 返回 计算 结果 : spread 数组 中 的 
最 大 者 ,这 是 一 个 带 小 数 的 实数 。 

(2) 第 2 一 5 行 声 明 程序 中 所 需 的 各 个 变量 。 

G) 第 7 一 9 行 的 两 重 for 循环 嵌 套 对 应 算法 3-10 中 第 4 一 7 行 的 for 循环 拱 套 ,完成 对 
数组 d 的 计算 。 第 10 行 调用 3. 2. 2 节 开 发 的 对 数组 的 快速 排序 函数 quickSort 对 数组 d 进 
行 升序 排序 。 第 11 行 和 第 12 行 的 for 循环 对 应 算法 3-10 中 第 9 行 和 第 10 行 的 循环 ,计算 
数组 spread。 第 14 行 调用 3. 2. 3 节 中 开发 的 实现 算法 3-7 的 SELECT 过 程 的 函数 select. 
找到 数组 spread 中 的 最 大 元 素 。 该 函数 的 原型 为 


void * select(void * a,int size,int p,int r,int i,int( * comp) (void * ,void * )) 


其 中 ,参数 a 表示 序列 size 表示 a 中 元 素 的 存储 宽度 ,p、r 表示 a 的 首尾 元 素 下 标 ,i 表示 要 
找 的 是 a 的 第 i 序 统计 ,comp 表示 a 中 元 素 的 比较 规则 。 


2. 逆序 问题 


我 们 看 到 ,比较 型 排序 过 程 通过 比较 前 后 两 个 元 素 A[ 让 .A[j](i<j) 的 大 小 ,来 决定 元 
素 的 位 置 是 否 需 要 调整 : 在 升序 排序 过 程 中 ,车 A[ 可 二 AL7 门 , 则 意味 着 这 两 个 元 素 的 相对 
位 置 需要 发 生 改变 。 对 i<j WEB ALE > AD ] R i\j 构成 A 的 一 个 逆序 。 逆 序 的 概念 出 
现在 很 多 学 科 中 ,例如 下 列 的 Get the Inversion 问题 就 需要 把 计算 整数 序列 的 逆序 数 问 题 
与 比较 型 排序 联系 起 来 思考 。 


Get the Inversion 


Description 

This term Amy begins to learn another important Course 一 Linear Algebra. When she 
comes to the determinant, she finds it boring to calculate the inversion of a given sequence 
every time. So she asked for her best friend Ray to write a Program to solve it. She would 
be his partner when dancing Rumba in return. The inversion is defined as follows: for a 
given sequence A, the inversion is the total number of pairs<i, j> satisfies i<j and A[i]> 
AL]. 

Input 

The input file contains multiple test cases. The first line contains the size of the 
sequence,an integer N(1<N<500000), Then N integers come indicating the element of 


the sequence. The element is an integer no more than 1.000.000.000. N=0 means the 
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end of the input and should not be processed. 
Output 
Output exactly one integer for each test case: the inversion of the given sequence. 


Sample Input 


Sample Output 


0 
1 


(题目 来 源 : ACM/ICPC 2007 南京 航空 航天 大 学 ) 
l. 问题 描述 与 分 析 


Amy 在 学 习 行列 式 时 , 常 为 计算 由 自然 数 1,2,…,n 构成 的 序列 的 逆序 数 而 感到 烦恼 。 
允诺 以 晚会 舞伴 作为 回报 ,请 好 朋友 Ray 为 她 编写 一 个 用 来 计算 序列 的 逆序 数 程序 。 

一 般 地 , 设 ALL. .wj 是 一 个 具有 nn 个 不 同 元 素 的 数组 。 若 i<j AALI> ALi]. W gA 
G DRH A WS. BID. HJ A——2.3.8.6.17 08.1.57, 2,57. —3.57. 
«4,527 «3,47 Ji 5 4 ER EAA A[1]—7271-—A[5].AL2]7371— A[5].ALC3]— 
821—A[5].A[4]—76—1—A[5].A[3]—86— [4]. AERE IE SETESEAR E CB ALT. wj 中 
逆序 个 数 。 问 题 形式 化 如 下 。 

输入 : 数组 AT ALDL].AD2] 7 AUI]. 

输出 : A 的 逆序 个 数 。 

我 们 知道 ,序列 的 逆序 数 与 比较 型 排序 有 着 密切 的 关系 : 逆序 意味 着 元 素 存储 位 置 的 
改变 。 利 用 这 一 观察 ,能 够 用 (nlgn) 的 时 间 把 序列 的 逆序 数 计算 出 来 。 定 义 一 个 全 局 变 
Tt count。 在 调用 过 程 MERGE 将 两 个 有 序 子 序列 A[ p. .gj] 和 A[g 十 1. .rj 合并 成 一 个 有 序 
序列 ADp. . 门 时 ,要 重复 比较 工 [可 与 RC 门 。 当 工 [可 之 RCI 门 时 ,就 发 生 半 一 ;十 1 个 逆序 ,这 
是 因为 工 [1. .mJ 是 有 序 的 ,L[]> RUIN, GA LU 2 Lm —1]2- LU TR] 
PAE Lim J, Lim —1].-- LU HOST. RU EX miti 4 CO, IEE Fok. EX 
一 个 序列 做 归并 排序 的 过 程 中 ,将 利用 count 计算 出 该 序列 的 逆序 数 。 


2. 算法 描述 


INVERSE-MERGE(A. p.q.7) 
lm-*q4—pl 

2n-r—q 

3 创建 数组 LCL. . m JAI RIL. me] 
4 将 ALp. .gj 复制 到 LO.. m] 

5 将 AL[g 十 1. .7 复制 到 RCL. n] 
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6ic—lj-l 
7 k-—p 

8 while i—n and j n: 
9 doit LEJR] 


10 then ALE]-- LL] 

11 perta 

12 else ALE]—-RLj] 

13 jecjtl 

14 count*-count--n; —i+1 DiR m —i+1 FHF 
15 if in, 

16 then ¥ LCi.. m 1 808] AL.. 7] 

17 if jn, 


18 then 将 R[i.. ns] 复制 到 ALA. . 门 


GET-THE-INVERS(A , por) 

lif p<r 

2 then gL(ptr)/2 | 

4 GET-THE-INVERS (A, p,q) 

5 GET-THE-INVERS (A,g+1,r) 
6 INVERSE-MERGE(A, pq») 


算法 3-11 改造 MERGE 和 MERGE-SORT 过 程 ,解决 Get the Inversion 问题 的 伪 代 码 过 程 


显然 ,由 于 这 个 算法 是 基于 归并 排序 的 ,所 以 它 的 时 间 复 杂 度 是 8(nlgn)。 因 此 ,这 会 
让 Amy 很 开心 。 


3. 程序 实现 


算法 3-11 的 C 程序 实现 与 3. 1. 1 节 的 程序 3-1 和 3. 2. 1 节 的 程序 3-6 十 分 相近 ,读者 
可 打开 chap03/Get The Inversion 文件 夹 内 的 源 文件 Get The Inversion. c 研读 。 


3.4 扒 与 基于 堆 的 优先 队列 
本 节 讨 论 一 个 非常 重要 的 数据 结构 一 一 二 叉 堆 以 及 基于 堆 的 优先 队列 。 
3.4.1 堆 的 概念 及 其 创建 


1. 二 又 堆 的 概念 


数据 结构 二 叉 堆 简称 为 堆 , 是 一 个 数组 对 象 A, 它 可 被 视 为 一 棵 几乎 完全 的 二 叉 树 ?。 
树 中 的 每 一 个 结 点 对 应 于 数组 中 的 一 个 元 素 , 该 元 素 存储 了 结 点 的 值 。 其 中 A[1] 为 树 根 ， 


O ”完全 二 叉 树 是 具有 下 述 性 质 的 二 叉 树 : 树 中 所 有 叶子 结 点 的 深度 一 致 , 且 每 一 个 内 点 都 有 两 个 孩子 。 
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i A[ 门 为 树 中 一 个 内 点 , 则 其 左 孩 子 为 A[L2 疏 ;车 AD VGGECT WR ET AD2i 1]. 
该 树 除了 最 底层 ,完全 填 满 了 ,最 底层 的 填充 是 从 左 到 右 进 行 的 。 表 示 堆 的 数组 A 具有 两 
个 属性 : length[Aj, 它 表示 数组 中 的 元 素 个 数 ,以 及 heap-size[LAj, 它 表示 存储 于 A rh e 
的 元 素 个 数 ,它们 之 间 具 有 heap-size[LA] 志 liength[A] $R. WAR A[1] 没 有 父亲 结 点 ,对 
给 定 结 点 的 下 标 iC > 1) ,其 父亲 的 下 标 PARENT(i) , 左 孩 子 的 下 标 LEFT(i) , 右 孩 子 的 下 标 
RIGHTGD) 可 以 直接 算得 : 
PARENTG) 
return [;/2 | 
LEFTG) 
return 2; 
RIGHTG) 
return 2i+1 


算法 3-12 存储 在 数组 中 的 二 叉 树 父子 结 点 间 下 标 换算 算法 


将 一 个 最 大 堆 视 为 图 3-9(a) 所 示 的 一 棵 二 叉 树 和 图 3-9(b) 所 示 的 一 个 数组 。 树 中 每 
个 结 点 圈 中 的 数 是 存储 于 该 结 点 的 值 。 结 点 上 方 的 数 对 应 于 它 在 数组 中 的 下 标 。 数 组 上 方 
与 下 方 的 线条 表示 父 - 子 关系 ;父亲 总 是 位 于 孩子 的 左边 。 树 的 高 度 为 3; 下 标 为 4 的 结 点 
( 值 为 8) 的 高 度 为 1 。 


图 3-9 二 叉 堆 


MER ERR. 最 大 堆 和 最 小 堆 。 在 最 大 堆 中 ,最 大 堆 的 性 质 是 对 每 一 个 非 根 结 点 i 
AL[PARENTCO ] 宇 A[ 门 , 即 结 点 的 值 至 多 为 其 父亲 的 值 。 于 是 ,最 大 堆 中 最 大 的 元 素 就 存储 
在 根 中 ,而 以 某 结 点 为 根 的 子 树 中 所 含 的 所 有 结 点 值 不 会 大 于 该 结 点 的 值 。 最 小 堆 是 以 相 
反 的 形式 组 织 的 ;最 小 堆 的 性 质 是 对 每 一 个 非 根 结 点 ILALPARENTOD ]A Li]. dE rp 


的 最 小 元 素 就 是 根 。 
特殊 地 , 若 几乎 完全 二 叉 树 仅 含 一 个 元 素 ( 也 是 树 根 ), 则 可 自然 地 视 为 一 个 堆 , 称 其 为 
单元 素 堆 。 


关于 存储 于 数组 中 的 几乎 满 二 叉 树 ,可 以 不 加 证 明 地 罗列 下 面 两 个 有 用 的 结论 。 

定理 3-4 具有 个 元 素 的 数组 表示 的 几乎 满 二 又 树 的 高 度 h 满足 h — Og. 

定理 3-5 ”在 存储 于 数组 AL.. wj] 中 的 几乎 满 二 叉 树 ,A[ln/2 H-11,ADO/2 | 二 2]、…、 
A[z] 都 是 叶子 。 
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2. (RENE RAP 


1) 问题 描述 

本 节 以 下 部 分 以 最 大 堆 为 例 , 讨 论 堆 的 创建 。 首 先 ,需要 能 够 维护 堆 的 性 质 。 所 谓 堆 性 
质 的 维护 ,是 假定 在 数组 A 中 ,元 素 A[ 站 为 根 的 完全 二 又 树 的 左 、 右 两 个 孩子 都 已 构成 堆 ， 
但 A[ 站 可 能 与 它 的 两 个 孩子 相 比 不 符合 堆 性 质 ,需要 调整 A[ 订 与 其 子孙 的 位 置 使 得 ALI] 
为 根 的 完全 二 又 树 成 为 一 个 堆 。 该 问题 的 形式 化 表示 如 下 。 

输入 : 数组 ALL. .wj 存储 一 棵 几乎 完全 二 叉 树 , 正 整 数 i。 其 中 以 A[ 门 为 根 的 子 树 中 ， 
A[ 站 的 两 个 孩子 已 构成 最 大 堆 。 

输出 : 数组 A。 其 中 ,以 A[ 门 为 根 的 子 树 中 的 结 点 布局 有 所 变动 构成 最 大 堆 。 

解决 此 问题 的 想法 : 比较 ALA] ALAWAR F ALL] AER. A[r] 的 大 小 , 取 最 大 者 与 
A[ 门 交换 位 置 。 这 样 原 问 题 就 转换 成 了 左 子 树 或 右 子 树 的 树 根 的 堆 性 质 维 护 问 题 ,递归 地 
解决 子 问题 。 

图 3-10 所 示 为 MAX-HEAPIFY(A,2) 的 作用 ,其 中 heap-sizeLAj] 二 10。 图 3-10(a) 为 初 
始 格局 ,在 结 点 i==2 处 AL2] 违 背 了 最 大 堆 性 质 , 因 为 它 没有 它 的 孩子 大 。 对 结 点 2 的 最 大 
堆 性 质 的 恢复 是 通过 在 图 3-10(b) 中 交换 AL2] 和 AL4] ,而 这 又 破坏 了 结 点 4 f dc A MEE 
质 。 递 归 调 用 MAX-HEAPIFY(A D ,现在 的 ;为 4。 交换 AL4] 和 AL[9] 后 ,如 图 3-10(c) 所 
示 , 结 点 4 已 修正 ,递归 调用 MAX-HEAPIFY(A,9) 时 的 数据 结构 不 再 变化 。 


3-10 MA-HEAPIFY(A,2) 的 作用 


2) 算法 的 伪 代 码 描述 

将 算法 思想 写成 伪 代码 ,如 下 所 示 。 
MAX-HEAPIFY(A i) 

1 <LEFT(i) 

2 r-- RIGHTG) 

3 if /heap-size[ A] and A[1]>A[] 
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4 then /argest< 

5 else largest*-i 

6 if r<heap-size[A] and A[r]>AlLlargest] 
7 then largest<r 

8 if largestFi 

9 then exchange A[i]+*A[largest] 

10 MAX-HEAPIFY(A , largest) 


算法 3-13 ”最 大 堆 性 质 维护 算法 


3) 算法 的 运行 时 间 
下 面 来 考虑 MAX-HEAPIFY 过 程 在 最 坏 情 形 下 的 运行 时 间 TG) ,其 中 站 表示 以 AI 


为 根 的 子 树 的 结 点 数 。 注 意 在 过 程 中 除了 第 10 行 对 自身 的 递归 调用 外 ,所 做 的 所 有 操作 都 
在 常数 时 间 内 完成 。 所 以 ,最 坏 情 形 取决 于 递归 调用 时 处 理 的 子 问 题 的 规模 。 什 么 情况 下 
子 问题 的 规模 最 大 呢 ? 注意 到 堆 是 一 棵 几乎 完全 Ali] 


的 二 


叉 树 ,所 以 ,最 坏 情形 发 生 在 子 问题 是 A[ 门 的 

左 孩 子 是 满 二 叉 树 且 恰 比 右 和 孩子 多 一 层 。 设 AL] [i 

为 根 的 子 树 高 为 有 , 则 左 孩 子 高 为 一 1, 而 右 孩 子 h ER 

的 高 为 一 2( 见 图 3-11). 1 1 
右 子 树 的 规模 为 27 -1, 左 子 树 的 规模 为 右 Lamm 


子 树 的 规模 2 —1 加 上 最 后 一 层 叶子 数 ( 图 3-11 图 3-11 A[ 门 的 子 树 的 规模 

中 带 有 阴影 部 分 ) ,而 这 些 叶 子 共 有 2”? 片 。 因 此 ， 

A[ 门 为 根 的 子 树 的 结 点 数 2 一 3。2 和 一 3, 左 子 树 规模 为 2。2 和 :一 1 盖 2z/3。 于 是 ,得 到 
MAX-HEAPIFY 过 程 在 最 坏 情形 下 的 运行 时 间 的 递归 方程 为 T(x) 二 TT(2n/3) 十 8@(1), 其 中 
(1) 表 示 常 数 时 间 。 令 ae=1,c=3/2, 利 用 定理 3-1, 不 难 解 出 T(z) — Og. FINE 
理 3-3, 上 述 结 论 还 可 以 描述 为 MAX-HEAPIFY 过 程 在 最 坏 情 形 下 的 运行 时 间 渐 近 为 
以 A[ 门 为 根 的 子 树 的 高 度 ho 
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由 于 算法 3-13 属于 末尾 递归 , 故 很 容易 将 其 转换 成 如 下 等 价 的 迭代 版 本 。 


MAX-HEAPIFY(A,i) 

1 1<LEFT(i) 

2 r+RIGHT() 

3 if /heap-size[ A] and ALL] ALI] 

4 then largest l 

5 else largest*-i 

6 if r<heap-size[A] and A[r]>ALlargest] 
7 ‘then largest<-r 

8 while /argestz^i 

9 do exchange A[i]e*A[largest] 

10 i<largest 

11 I-—LEFTG) 

12  r-—RIGHT(D 

13 if l<heap-size[A] and A[1]>A[i] 
14 then /argest--l 
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15 else largest<—i 
16 if r<heap-size[A] and A[r]>A[largest] 
17 then largest<-r 


算法 3-14 ”维护 最 大 堆 性 质 过 程 的 迭代 版 本 


算法 过 程 的 名 称 仍然 沿用 MAX-HEAPIFY, 前 7 行 的 操作 与 递归 版 本 中 的 一 致 ,计算 
A[ 门 的 左 、 右 孩子 下 标 1.r。 并 计算 AL ALL A[ 门 中 最 大 者 下 标 largest, 58 8 一 17 行 的 
while 循环 蔡 代 了 算法 3-13 中 的 递归 操作 。 循 环 条 件 是 largest Ai. Wl ALi JA RERI — A 
最 大 堆 的 根 。 循 环 体 中 第 9 行 执行 交换 AL] ALlargest] $ 10 一 12 行 调整 下 标 i\l\r, 第 
13~17 行 重新 计算 A[ 门 .A[ 由 ,ALr] 中 最 大 者 下 标 largest. 


3. 二 叉 堆 的 创建 


1) 问题 的 描述 

接 下 来 解决 堆 的 创建 问题 。 

输入 : 数组 A[1. .nn]。 

输出 : 重 排 后 的 数组 ALL. .站 ,元 素 间 构成 一 个 堆 。 

2) 算法 的 伪 代 码 描述 

利用 过 程 MAX-HEAPIFY 以 自 底 向 上 的 方式 将 数组 ACL. .站 转换 为 一 个 最 大 堆 。 由 于 
子 数组 A[Ln/2 片 1.. 妆 的 每 一 个 元 素 都 没有 左右 孩子 ,所 以 都 是 树 的 叶子 结 点 ,因此 每 一 
个 均 构 成 为 一 个 单元 素 堆 。 过 程 BUILD-MAX-HEAP 检测 树 中 的 其 余 结 点 并 对 每 个 结 点 运 
47 MAX-HEAPIFY. 


BUILD-MAX-HEAP(A) 

1 heap-size[ A ]<length[A]} 

2 for i<-Llength[A]/2 |downto 1 
3 do MAX-HEAPIFYCA i) 


算法 3-15 创建 最 大 堆 算 法 


图 3-12 所 示 为 BUILD-MAX-HEAP 的 操作 。 图 3-12(a) 为 10 个 元 素 的 输入 数组 A 以 及 
由 它 表 示 的 二 叉 树 。 图 形 展 示 了 调用 MAX-HEAPIFY(A, 让 前 ,循环 下 标 i 指向 结 点 5。 
图 3-12(b) 为 结果 数据 结构 。 下 一 次 重复 的 循环 下 标 i 指向 结 点 4。 图 3-12(c) 一 图 3-12(e) 
为 BUILD-MAX-HEAP 的 for 循环 后 来 的 各 次 重复 。 请 注意 无 论 MAX-HEAPIFY 对 哪个 结 
点 调用 ,该 结 点 的 两 棵 子 树 都 已 是 最 大 堆 。 图 3-12 (1) Jg. BUILD-MAX-HEAP 完成 后 的 最 
XE. 

30 算法 的 正确 性 

BUILD-MAX-HEAP 是 一 个 典型 的 渐 增 型 过 程 。 设 n A length[Aj, 可 以 归纳 出 如 下 循 
环 不 变量 。 

在 第 2 行 和 第 3 行 的 for 循环 每 次 重复 之 初 , 每 个 结 点 A[i 十 1]、A[i 十 2]、…、A[Lnj 都 
是 一 个 最 大 堆 的 根 。 

先 用 归纳 法 证 明 这 一 循环 不 变量 。 
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4 [4[1[3[ 216] o ropa 8 | 7 


图 3-12 BUILD-MAX-HEAP 的 操作 


对 选 环 的 重复 次 数 j 而 言 ,j 二 1 时 ,i 二 Ln/2 | 此 时 ,根据 定理 3-4 知 ,A[Ln/2 H-1]. 
A[ln/2 上 2],…,A[n] 都 是 叶子 , 故 满足 循环 不 变量 。 

BE dcj—2lmmn/2r i1. 假定 此 时 满足 循环 不 变量 为 真 , 即 A[i 十 1]， 
A[i 十 2],…,A[n] 都 是 一 个 最 大 堆 的 根 。 在 本 次 重复 中 ,第 3 行 调用 过 程 MAX-HEAPIFY 
CAD ,使 得 A[ 门 ,A[i 十 1],A[i 十 2],…,ALnj 都 是 最 大 堆 的 根 。 下 一 次 重复 前 i 减 小 1, 这 
就 表述 为 A[i 十 1],A[i 十 2],…,ALn] 都 是 最 大 堆 的 根 。 至 此 ,循环 不 变量 得 到 证 明 。 

当 循 环 结束 时 ,i 二 0, 利 用 此 循环 不 变量 ,A[1],A[2],…,A[n] 均 为 最 大 堆 的 根 。 

4) 算法 的 运行 时 间 

假定 序列 A 中 有 个 元 素 。BUILD-MAX-HEAP 过 程 的 主体 是 第 2 行 和 第 3 行 的 for 
循环 。 循 环 重复 n/2 次 ,每 次 重复 调用 MAX-HEAPIFY 过 程 , 耗 时 O(lgz)。 所 以 它 的 时 间 
复杂 度 为 O(nlgn)。 利 用 其 几乎 完全 二 又 树 的 特性 ,可 以 更 精细 地 计算 出 BUILD-MAX- 
HEAP 过 程 的 运行 时 间 为 OC). 

注意 算法 BUILD-MAX-HEAP 的 第 3 行 调用 过 程 MAX-HEAPIFY(A,i) 调 整 以 A[ 门 为 
根 的 子 树 的 堆 性质 耗 时 O) .0 三 h 过 lgn。 可 以 用 归纳 法 证 明 , 在 一 棵 具有 个 结 点 的 几乎 
完全 二 叉 树 中 ,高 度 为 h 的 子 树 有 n/2”*!' 棵 。 于 是 ,算法 3-15 中 第 2 行 和 第 3 行 的 For 循环 
耗 时 可 表示 为 
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len len h len a 
n n H n 1 
Qh t= F(Z) i20) 


Sha Sia <2 ho ( 正 项 级 数 有 限 项 之 和 小 于 无 限 项 之 和 ) 
= 2 Gh E aey (震级 数 在 收敛 域内 可 逐 项 求 导 ) 
Aa “Td = (season 在 收敛 域 中 的 和 函数 为 -二 
EE 4—n 
有 了 BUILD-MAX-HEAP 过 程 后 ,就 可 以 在 B(z) 时 间 内 将 一 个 数组 创建 为 一 个 堆 。 
4. 程序 实现 


将 实现 算法 3-12、 算 法 3-14 和 算法 3-15 的 C 函数 原型 声明 如 下 。 


1 int leftCint i); 

2 int rightCint i); 

3 int parentCint i); 

4 void heapify(void * a.int size,int i,int heapSize.int( * comp) (void * ,void * )); 
5 void buildHeap(void * a,int size,int length,int( * comp) (void * ,void * )); 


程序 3-14” 堆 操作 函数 的 原型 声明 
其 中 ,第 1 一 3 行将 实现 算法 3-12 的 3 个 父子 转换 过 程 ,第 4 行将 实现 算法 3-14 的 堆 性 
质 维 护 过 程 ,第 5 行将 实现 算法 3-15 的 堆 创 建 过 程 。 把 这 些 函 数 原 型 声明 代码 存储 为 
utility 文件 夹 中 的 头 文件 heap. h. 
1) 父子 结 点 换算 函数 


1 int leftCint i) { 


2 return 2 * i 十 1; 
3) 

4 int right(int i) ( 

5 return 2 * i 十 2; 
6} 

7 int parentCint i) { 

8 return (i—1)/2; 
9) 


程序 3-15 ”实现 算法 3-12 的 C 函数 
函数 left, right 和 parent 分 别 实现 算法 3-12 中 的 LEFT, RIGHT 和 PARENT 过 程 。 与 
对 应 伪 代 码 过 程 相 比 ,参数 是 一 致 的 ,都 是 表示 结 点 在 数组 中 的 下 标 i。 返 回 值 的 表达 式 与 
伪 代 码 中 的 有 所 不 同 ,原因 是 伪 代 码 中 数组 的 下 标 是 从 1 开始 的 ,而 C 语言 中 的 数组 下 标 
是 从 0 开始 的 。 
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2) 堆 性 质 维护 函数 
此 处 实现 维护 堆 性 质 的 迭代 过 程 。 


1 void heapify(void * a,int size,int i,int heapSize,int( * comp) (void const * ,void const * )){ 
int I—leftCD ,r= right( «most; 
if(I- heapSize&- &-comp( char * )a4-1 * size, (char * )a 十 ix size) 70) 

most=1; 


2 

3 

4 

5 else 
6 most—i; 

7 if( r<heapSize&. &.comp( (char * )a 十 rx size, (char * )a-- most * size) 70) 
8 most—r; 

9 


whileCmost! =i) ( 


10 swap((char * )a+i * size, (char * )a-d- most * size, size) ; 

11 i— most; 

12 l=left(D) »r=right() ; 

13 if(I- heapSizeS-8.comp((char * )a 十 1 * size, (char * )a 十 ix size) 70) 
14 most=1; 

15 else 

16 most—i; 

17 if( r- heapSize&- &-comp( (char * )a+r * size, (char * )a+most * size) ^0) 
18 most=r3 

19 } 

20 } 


BF 3-16 ”实现 算法 3-14 的 C 函数 


对 程序 3-16 的 说 明 如 下 。 

(1) 由 于 目标 是 开发 出 适用 于 最 大 堆 和 最 小 堆 , 堆 中 元 素 可 以 是 任何 类 型 的 数据 的 通用 
过 程 ,所 以 除了 要 向 函数 传递 作为 问题 输入 的 数组 A 和 子 树 根 结 点 位 置 ; 以 外 ,还 需要 传 数 
组 元 素 的 存储 宽度 size, 元 素 间 的 比较 规则 comp。 因 为 堆 性 质 将 维持 在 序列 A 中 ,所 以 无 
须 返 回 任何 值 。 此 外 ,上 文 提 到 ,表示 堆 的 数组 A 具有 两 个 域 : length LA ] "E o RICH IP h 
元 素 个 数 ; 以 及 heap-sizeLAj, 它 表示 堆 中 的 元 素 个 数 。 由 于 仅仅 将 一 个 数组 作为 堆 空 间 ， 
并 未 将 其 作为 一 个 独立 的 数据 类 型 ,所 以 可 以 将 这 些 属性 作为 参数 加 以 传递 ,在 本 函数 中 需 
要 传递 表示 堆 中 元 素 个 数 的 heapSize, 用 来 对 结 点 下 标 进行 合法 性 检测 。 

(2) 根据 算法 伪 代 码 的 上 下 文 知 ,程序 中 需 设置 两 个 下 标 变量 /和 来 记录 A[ 门 的 左 、 
右 孩 子 的 位 置 。 此 外 ,算法 是 专门 用 来 维护 最 大 堆 的 ,有 一 个 用 来 跟踪 ADT] ALC] ACr TP 
最 大 者 的 变量 largest, 而 所 实现 的 程序 既 要 能 用 于 最 大 堆 也 能 用 于 最 小 堆 , 所 以 对 这 一 变 
量 命 名 为 most. 

(3) 由 于 用 序列 中 元 素 的 比较 规则 comp 来 控制 堆 的 类 型 (最 大 堆 或 最 小 堆 ), 所 以 在 判 
断 元 素 大 小 关系 处 都 以 comp 为 准 。 此 外 ,利用 程序 3-3 定义 的 swap 函数 来 执行 交换 两 个 
变量 的 操作 。 

3) 堆 创 建 函 数 


1 void buildHeap(void * a,int size,int length,int( * comp) (void * ,void * )){ 
2 int i; 
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3 for(i=length/2;i>=0;i——) 
4 heapify(a, size,i,length, comp) ; 
5} 


程序 3-17 实现 算法 3-15 89 C 函数 


对 程序 3-15 的 说 明 如 下 。 

CD. 算法 解决 的 是 最 大 堆 的 创建 问题 ,我 们 的 目标 是 开发 一 个 既 能 创建 最 大 堆 又 能 创 
建 最 小 堆 的 程序 过 程 ,所 以 传递 给 过 程 的 参数 除了 数组 A 以 外 ,还 需 传递 数组 元 素 的 存储 
宽度 size、 数 组 长 度 length 以 及 元 素 间 的 比较 规则 comp。 创 建 的 堆 维持 在 序列 A 的 存储 
空间 内 ,所 以 无 须 返 回 任何 值 。 

(2) 程序 中 需要 设置 一 个 整 型 的 循环 控制 变量 i。 由 于 已 经 知道 了 将 要 创建 的 堆 空 间 
的 长 度 就 是 堆 长 度 , 所 以 无 须 再 对 堆 长 度 做 任何 修改 。 

将 程序 3-15 至 程序 3-17 的 代码 保存 在 utility 文件 夹 中 的 源 文件 heap. c 中 ,以 备 重用 。 


3.4.2 基于 二 又 堆 的 优先 队列 


优先 队列 就 是 进入 队列 的 每 一 个 元 素 都 有 各 自 的 优先 级 ,每 次 出 队 操作 的 对 象 是 队列 
中 优先 级 最 高 的 元 素 。 往 往 用 一 个 线性 表 来 实现 优先 队列 ,实现 的 方案 有 多 种 。 例 如 ,每 次 
出 队 操 作 前 ,对 线性 表 按 优先 级 排序 ,然后 将 优先 级 最 高 的 元 素 ( 此 时 ,该 元 素 必 在 表 首 或 表 
尾 ) 出 队 。 如 果 排 序 过 程 采 用 比较 型 算法 , 则 出 队 操 作 至 少 耗 时 BCzlgz)( 见 3.3. 1 节 )。 还 可 
以 利用 选择 算法 SELECT( 见 3. 2. 3 节 ) ,选择 表 中 优先 级 最 高 的 元 素 出 队 , 这 也 至 少 要 消耗 
Oc) INT Tal 

我 们 知道 ,存储 堆 的 数组 的 第 一 个 元 素 就 是 最 大 的 (或 最 小 的 ), 所 以 可 以 利用 堆 来 作为 
优先 队列 的 元 素 载体 。 

优先 队列 有 两 个 基本 操作 : 入 队 操 作 ENQUEUE(Q,e) ,其 中 参数 Q 是 优先 队列 ,e 是 要 
加 入 队列 的 元 素 。 出 队 操作 DEQUEUE(Q) , 它 将 返回 Q 中 优先 级 最 大 (最 小 )。 下 面 来 讨论 
利用 最 大 堆 的 最 大 优先 队列 Q ,假定 Q 是 一 个 最 大 堆 。 


1. 入 队 算 法 描述 与 分 析 


对 于 入 队 操 作 , 把 要 加 入 的 元 素 放 在 堆 的 末尾 ,然后 维护 堆 性 质 一 一 从 新 的 末尾 开始 ， 
检测 到 当前 元 素 的 优先 级 大 于 其 父亲 结 点 元 素 的 优先 级 ,两 者 交换 。 

ENQUEUE(Q,e) 

1 if heap-sizeL Q]— length U Q] 

2 then error "Hi | ii" 

3 i*-hea p-size[ Q]--heap-size[ Q]--1 

4 A[i]—e 

5 while i>1 and ALPARENT(i) ]<A[i] 

6 do exchange ALi] * AL PARENTCO ] 

? i--PARENTG) 


算法 3-16 ”基于 最 大 堆 的 优先 队列 人 队 算 法 
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显然 ,ENQUEUE 过 程 的 运行 时 间 取 决 于 第 5 一 7 行 的 while 循环 的 重复 次 数 。 循 环 体 中 的 
第 7 行 是 将 当前 结 点 变换 为 父 结 点 ,所 以 该 循环 至 多 重复 堆 的 树 高 lgn 次 。 所 以 ， 
ENQUEUE 过 程 的 运行 时 间 为 8(lgz) 。 


2. 出 队 算 法 描述 与 分 析 


对 于 出 队 操作 ,只 要 将 堆 Q 中 的 最 大 元 素 (Q[1]) “舍弃 ”: QU1] MEF mar, H 
Q[heap-size[LQj]] 赋 予 QL1] ,并 使 heap-size 减 小 1。 然 后 维护 剩余 元 素 的 堆 性 质 , 并 返回 
maz。 伪 代码 如 下 。 


DEQUEUE (Q) 

1 if hea p-size[ Q]—1 

2 then error "HE F di" 

3 mar--Q[1] 

4 QL1]—QLhea p-sizeL Q1] 

5 hea p-size[ Q]*-hea p-size[ Q]—1 
6 Max-HEAPIFYCQ, 1) 


7 return max 


算法 3-17 ”基于 最 大 堆 的 优先 队列 出 队 算法 


本 过 程 中 除了 第 6 行 调用 MAX-HEAPIFY 过 程 耗 时 8@(lgn) 外 ,其 余 所 有 操作 都 在 常数 
时 间 内 完成 ,所 以 出 队 操 作 的 运行 时 间 为 OAgn) 。 


3. 程序 实现 


作为 重要 的 数据 结构 ,在 C 语言 中 把 基于 二 又 堆 的 优先 队列 定义 成 如 下 结构 体 。 
1) 数据 类 型 


1 typedef struct | 


2 void * heap; /* 指 向 存储 队列 元 素 的 数组 的 首 元 素 指针 / 
3 int eleSize; / * 元素 存储 宽度 */ 

4 int length; / * BAKE * / 

5 int heapSize; /* 堆 中 的 元 素 个 数 */ 

6 int(*compare)(void * ,void * ); /* 元 素 比较 函数 x*/ 

7 }PQueue; /* 基 于 堆 的 优先 队列 类 型 * / 

8 PQueue * initPQueue(int size, int n,int( * comp) (void * ,void * )); / * 创建 队列 * / 
9 void pQueueClr(PQueue * q); / * 清理 队列 存储 空间 * / 

10 int empty(PQueue * q); /* 检测 队列 是 否 为 空 */ 

11 void enQueue(PQueue * q.void * e); /* 人 入 队 操 作 */ 

12 void * deQueue(PQueue * q); /出 队 操作 x*/ 


程序 3-18 ”定义 基于 堆 的 优先 队列 数据 类 型 并 声明 优先 队列 操作 函数 的 C 代码 


对 程序 3-18 的 说 明 如 下 。 
(1) 第 1 一 7 行将 优先 队列 定义 为 结构 体 类 型 PQueue。 它 有 5 个 属性 ,heap 是 指向 存 
储 队 列 元 素 的 数组 的 首 元 素 指针 ,该 数组 中 的 数据 将 被 组 织 成 一 个 堆 。eleSize 表示 数组 中 
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的 元 素 存储 宽度 。length 表示 数组 的 长 度 。heapSize 表示 堆 中 的 元 素 个 数 。compare 表示 
队列 中 元 素 之 间 优 先 级 大 小 比较 规则 。 

(2) 第 8 行 声明 的 函数 initPQueue 用 来 创建 一 个 容量 为 nC KR IEW size MIBK 
小 比较 规则 为 comp 的 优先 队列 。 第 9 行 声明 的 函数 pQueueClr 用 来 对 程序 中 不 再 使 用 的 
优先 队列 q 清理 内 存 空间 ,之 所 以 要 这 样 做 是 因为 队列 中 heap 指针 指向 一 块 动态 分 配 的 内 
FE ,废弃 前 应 将 这 块 内 存 释 放 掉 。 第 10 行 声明 的 函数 empty 用 来 检测 优先 队列 q 是 否 为 
空 。 这 3 个 函数 对 优先 队列 做 常规 维护 操作 。 

(3) 第 11 行 和 第 12 行 声 明 的 函数 enQueue .deQueue 分 别 实现 算法 3-15 和 算法 3-16 
的 ENQUEUE 和 DEQUEUE 过 程 。 

为 便于 代码 重用 ,将 程序 3-18 存储 为 文件 夹 datastructure 中 的 头 文件 pqueue. h. 

2) 常规 维护 操作 

优先 队列 常规 维护 函数 定义 如 下 。 


1 PQueue * initPQueue(int size,int n,int( * comp) (void * ,void * )){ / x 创建 空 队 列 * / 


2 PQueue * q— (PQueue * ) malloc(sizeof( PQueue)) ; 

8 assert(q) ; 

4 q->eleSize= size; / * 设置 元 素 存储 宽度 * / 
5 q->length=n; /* 设 置 堆 的 最 大 长 度 * / 
6 q->heap= (void * )malloc(n * size) ; / x 分 配 堆 空间 * / 

7 q->heapSize=0; /* 目前 队 空 * / 

8 q->compare= comp; / x 设置 元 素 比 较 规则 * / 
9 return q; 

10 } 

11 void pQueueClr(PQueue * q){ /* 清理 队列 存储 空间 * / 


12 free(q->heap) ; 

13 q->heap=q->compare= NULL; 

14 q->heapSize=q->length=q->eleSize=0; 
15 } 

16 int empty(PQueue * q){ 

17 return q->heapSize<1; 

18 } 


程序 3-19 ”优先 队列 常规 维护 操作 函数 的 定义 


对 程序 3-19 的 说 明 如 下 。 

CD 第 1 一 10 行 定义 的 函数 initPQueue 用 参数 size 确定 队列 q 中 元 素 的 存储 宽度 属性 
eleSize( 第 4 行 ), 用 参数 n 确定 队列 q 最 多 可 存储 的 元 素 个 数 length( 第 5 行 ) ,并 为 q 的 堆 
分 配 的 长 度 为 length, 每 个 元 素 宽 度 为 eleSize 的 数组 空间 (第 6 行 )。 第 7 行将 gq 的 
heapSize 属性 置 为 0, 表示 所 创建 的 队列 初始 时 是 空 的 。 第 8 行 用 参数 comp 设置 队列 q 的 
元 素 优先 级 的 比较 规则 。 

(2) 第 11 一 15 行 定义 的 函数 pQueueClr 负责 在 程序 废弃 优先 队列 q 之 前 释放 其 堆 空 
间 heap( 第 12 行 ) ,并 将 其 中 的 各 指针 属性 指向 安全 的 空地 址 NULL. 

(3) 第 16 一 18 行 定义 的 函数 empty 通过 检测 优先 队列 的 堆 长 度 属性 heapSize 是 否 小 
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于 0 来 判断 q 是 否 为 空 。 
3) 入 队 操作 
优先 队列 的 入 队 操作 算法 实现 如 下 。 


1 void enQueue(PQueue * q,void * e) { 


2 int i, heapSize— q-»heapSize. length= q->length, eleSize— q-»eleSize; 

3 int( * comp) (void * ,void * ) =q->compare; 

4 void * heap=q->heap; 

5 assertCheapSize- length) ; /* 防止 队列 满 */ 

6 i=heapSize+ +; q->heapSize+ +; /*i 为 扩大 后 的 堆 的 最 后 元 素 的 下 标 * / 
2 memepy( (char * )heap 十 ix eleSize, (char * )e,eleSize) ; / * heap i]«-e * / 
8 while (i708. &comp( (char * )heap+ parent i) * eleSize, (char * )heap-- i * eleSize) <0) ( 
9 swap((char * ) heap i * eleSize, (char * )heap+ parent(i) * eleSize,eleSize) ; 

10 i— parent () ; 

1 j 

12) 


程序 3-20 ”实现 算法 3-16 的 人 队 过 程 ENQUEUE 的 C 函数 定义 


对 程序 3-20 的 说 明 如 下 。 
CD. 由 于 将 队列 中 元 素 的 存储 宽度 和 元 素 间 优先 级 比较 规则 作为 优先 队列 的 属性 ,所 
以 入 队 操 作 琴 数 的 参数 与 伪 代 码 过 程 的 参数 一 样 简洁 ,参数 为 队列 q 和 要 入 队 的 元 素 eo 
(2) 为 使 代码 简短 ,第 2 一 4 41H a 的 各 属性 初始 化 相应 的 简单 变量 。 
(3) 第 6 行 的 赋值 操作 i= heapSize 十 十 ,i 得 到 的 是 heapSize 自 增 前 的 值 ,heapSize 
自 增 后 heap[i] 8E J& heap[heapSize 一 1], 即 扩展 后 堆 空 间 最 后 一 个 元 素 。 该 行 中 的 
q->heapSize 十 十 实际 完成 推 空间 的 扩展 。 
4) 出 队 操作 
优先 队列 的 出 队 操作 算法 实现 如 下 。 
1 void * deQueue(PQueue * q){ 
int heapSize— q-»heapSize, length — q-» length, eleSize— q—>eleSize; 
int( * comp) (void * ,void * ) —q-»compare; 
void * heap=q->heap, * top; 
assert( l'empty(q)) ; /* 防 止 队列 空 * / 
assert(top— (void * ) malloc(eleSize)) ; 
memepy( top, heap, eleSize) ; / * top*-heap[0] * / 
heapSize— — ;q->heapSize— — ; 
memcpy( (char * )heap, (char * ) heap+heapSize * eleSize, eleSize) ; 
10 _ heapify(heap, eleSize,0 ,heapSize, comp) ; 


4 0 - O Oc & ww 


11 return top; 
12) 


程序 3-21 ”实现 算法 3-17 中 出 队 操作 过 程 DEQUEUE 的 C 函数 


与 程序 3-20 相仿 ,函数 deQueue 的 参数 非常 简洁 一 一 只 有 优先 队列 q。 操 作成 功 将 返 
回 原 队列 中 优先 级 最 高 的 元 素 指 针 。 注 意 . 将 伪 代 码 中 的 赋值 操作 代 之 以 memcpy 的 调用 ， 
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比较 运算 代 之 以 comp 的 调用 ,函数 deQueue 的 代码 与 过 程 DEQUEUE 的 伪 代 码 十 分 相近 。 
为 便于 代码 重用 ,将 程序 3-19 至 程序 3-21 的 代码 存储 为 文件 夹 datastructure 中 的 源 
文件 pqueue. c。 


3.4.3 应 用 


优先 队列 在 现实 模拟 中 有 广泛 应 用 ,考虑 下 面 的 问题 。 
Department 


The Department of Security has a new headquarters building. The building has 
several floors. and on each floor there are rooms numbered xxyy where yy stands for the 
room number and zz for the floor number. 0 — xx, yy 10. The building has *pater- 
noster? elevator.i.e. elevator build up from several cabins running all around. From time 
to time the agents must visit the headquarters. During their visit they want to visit several 
rooms and in each room they want to stay for some time. Due to the security reasons, there 
can be only one agent in the same room at the same time. The same rule applies to the 
elevators. The visits are planned in the way ensuring they can be accomplished within one 
day. Each agent visits the headquarters at most once a day. 

Each agent enters the building at the 1st floor. passes the reception and then starts to 
visit the rooms according to his/her list. Agents always visit the rooms by the increasing 
room numbers. The agents form a linear hierarchy according to which they have assigned 
their one letter personal codes. The agents with higher seniority have lexico-graphically 
smaller codes. No two agents have the same code. 

If more than one agent wants to enter a room,or an elevator.the agents have to form a 
queue. In each queue.they always stand according to their codes. The higher the seniority 
of the agent. the closer to the top of the queue he stands. Every 5 s (seconds) the first 
agent in the queue in front of the elevator enters the elevator. After visiting the last room 
in the headquarters each agent uses if necessary elevator to the first floor and exits the 
building. 

The times necessary to move from a certain point in the headquarters to another are 
set as follows: Entering the building.i.e. passing the reception and reaching the elevator. 
or a room on the first floor takes 30 s. Exiting the building.i. e. stepping out of the 
elevator or a room on the first floor and passing the reception takes also 30 s. On the same 
floor,the transfer from the elevator to the room Cor to the queue in front of the room) ,or 
from the room to the elevator (or to the queue in front of the elevator) ,or from one room 
to another Cor to the queue in front of the room) takes 10 s. The transfer from one floor to 
the next floor above or below in an elevator takes 30s. Write a program that determines 


time course of agent's visits in the headquarters. 


153 


从 算法 到 程序 (第 2 NO 


Input 

The input contains the descriptions of n=0 visits of different agents. The first line of 
the description of each visit consists of agent's one character code C,C=A, +, Z, and the 
time when the agent enters the headquarters. The time is in the format HH: MM: SS 
(hours. minutes, seconds), The next lines (there will be at least one) contain the room 
number. and the length of time intended to stay in the room.time is in seconds. Each room 
is in a separate line. The list of rooms is sorted according to the increasing room number. 
The list of rooms ends by the line containing 0. The list of the descriptions of visits ends 
by the line containing the character dot. 

Output 

The output contains detailed records of each agent's visit in the headquarters. For 
each agent, there will be a block. Blocks are ordered in the order of increasing agent's 
codes. Blocks are separated by an empty line. After the last block there is an empty line 
too. The first line of a block contains the code of agent. Next lines contain the starting and 
ending time (in format HH:MM:SS) and the descriptions of his/her activity. Time data 
will be separated by one blank character. 

Description will be separated from time by one blank character. 

Description will have a form Entry. Exit or Message. The Message can be one of the 


following: 


Waiting in elevator queue 

Waiting in front of room RoomNumber 

Transfer from room RoomNumber to room RoomNumber 
Transfer from elevator to room RoomNumber 

Transfer from RoomNumber to elevator 

Stay in room RoomNumber 

Stay in elevator 


Sample Input 


A 10 : 00 : 00 
0101 100 
0110 50 

0202 90 

0205 50 

0 

B 10:01:00 
0105 100 
02015 

0205 200 

0 
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Sample Output 


A 

10 : 00:0010:00:30 Entry 

10 : 00 : 30 10 : 02 : 10 Stay in room 0101 

10 : 02 : 10 10 : 02 : 20 Transfer from room 0101 to room 0110 
10 : 02 : 20 10 : 03 : 10 Stay in room 0110 

10: 03 : 10 10 : 03 : 20 Transfer from room 0110 to elevator 
10 : 03 : 20 10 : 03 : 50 Stay in elevator 

10: 03 : 50 10 : 04 : 00 Transfer from elevator to room 0202 
10 : 04 : 00 10 : 05 : 30 Stay in room 0202 

10: 05 : 30 10 : 05 : 40 Transfer from room 0202 to room 0205 
10 : 05 : 40 10 : 07 : 40 Waiting in front of room 0205 

10 : 07 : 40 10 : 08 : 30 Stay in room 0205 

10: 08 : 30 10 : 08 : 40 Transfer from room 0205 to elevator 
10 : 08 : 40 10 : 09 : 10 Stay in elevator 

10 : 09 + 10 10 : 09 : 40 Exit 


B 

10 : 01: 00 10 : 01 : 30 Entry 

10 : 01 : 30 10 : 03 : 10 Stay in room 0105 

10 : 03 : 10 10 : 03 : 20 Transfer from room 0105 to elevator 
10 : 03 : 20 10 : 03 : 25 Waiting in elevator queue 

10 : 03 : 25 10 : 03 : 55 Stay in elevator 

10 : 03 : 55 10 : 04 : 05 Transfer from elevator to room 0201 
10 : 04 + 05 10 : 04 : 10 Stay in room 0201 

10 : 04 : 10 10 : 04 : 20 Transfer from room 0201 to room 0205 
10 : 04 : 20 10 : 07 : 40 Stay in room 0205 

10 : 07 : 40 10 : 07 : 50 Transfer from room 0205 to elevator 
10 + 07 : 50 10 : 08 : 20 Stay in elevator 

10 : 08 : 20 10 : 08 : 50 Exit 


l. 问题 描述 与 分 析 


安全 局 大 楼 内 有 10 层 , 每 层 有 10 个 房间 。 房 间 编号 由 4 位 数字 构成 : zzyy。 前 两 位 
0 二 zx 三 10 表示 楼 层 , 后 两 位 0 二 yy 二 10 表示 层 内 的 房间 号 。 例 如 0309 表示 3 E 9 SH. 
而 0107 表示 1 层 7 号 房 。 大 楼 装备 有 电梯 ,每 隔 os 就 有 一 个 箱 斗 可 载 一 位 乘客 。 上 下 一 
层 , 电 梯 耗 时 30s。 

安全 局 向 各 地 派出 26 个 特派 员 ,代号 分 别 为 A 一 Z。 代 号 越 排 前 ,等 级 越 高 ,也 就 是 说 
代号 为 A 的 等 级 最 高 ,而 代号 为 Z 的 等 级 最 低 。 特 派 员 需要 返回 安全 局 汇报 工作 或 接受 指 
令 。 一 天 内 可 能 有 若干 个 特派 员 返 回 安全 局 ,他 们 有 各 自 的 造访 计划 表 , 表 中 各 个 需 造 访 的 
房间 按 编号 升序 排列 (存放 在 输入 文件 中 ) .列表 中 的 每 一 项 包括 需 造访 的 房间 编号 和 需 在 
该 房间 内 停留 的 时 间 。 

出 于 保密 的 要 求 ,电梯 内 每 次 只 能 运载 一 个 人 . 若 有 两 个 人 需要 造访 一 个 房间 ,必须 一 
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个 完成 访问 离开 后 另 一 个 才能 进入 房间 。 因 此 ,在 每 一 个 房间 及 每 层 的 电梯 前 可 能 出 现 一 
个 访问 者 的 等 待 队 列 , 队 列 中 若 有 多 个 特派 员 来 到 的 时 间 相 同 , 则 按 它们 的 等 级 排列 , 即 等 
级 越 高 越 优先 。 于 是 ,房间 和 电梯 的 等 待 队列 应 当 是 优先 队列 。 

我 们 的 任务 是 为 这 一 天 所 有 回访 安全 局 大 楼 的 特派 员 制 作 一 份 实际 的 行程 列表 。 与 他 
们 的 计划 列表 相 比 ,行程 列表 将 标识 出 每 一 项 活动 的 实际 起 止 时 间 以 及 (如 果 有 的 话 ) 在 各 
等 待 队列 中 的 等 待 时 间 。 

可 以 为 每 一 层 电梯 和 每 一 个 房间 设置 一 个 优先 队列 来 模拟 各 特派 员 一 天 的 活动 ,跟踪 
他 们 实际 的 活动 时 间 来 完成 制作 每 个 人 的 行程 列表 。 


2. 算法 描述 


1) 数据 表示 

根据 题 意 说 明 ,一 个 特派 员 的 行程 数据 是 由 大 楼 内 的 一 个 个 房间 排列 而 成 ,每 个 房 
间 用 4 个 数字 表示 所 在 楼 层 与 房间 号 ,为 算法 描述 的 简洁 起 见 , 把 房间 设 为 具有 楼 层 
floor 和 房 号 number 两 个 属性 的 Room 对 象 。 其 中 ,1 过 floor<10 Ail 15 number <10, # 
将 电梯 视 为 特殊 的 房间 ,每 层 只 有 一 个 , 令 其 编号 为 0, 则 可 将 number 的 取 值 范围 扩展 为 
0<number <10, 

特派 员 的 行程 表 是 由 一 系列 的 事件 组 成 ,这 些 事件 归纳 在 表 3-1 中 。 在 表 中 还 对 不 同 
的 事件 给 出 不 同 的 类 型 编号 。 


表 3-1 行程 表 

x 件 类 型 持续 时 间 
进入 大 楼 0 30s 
等 待 电 梯 1 待定 ,初始 化 为 0s 
等 待 进入 房间 2 待定 ,初始 化 为 0s 
从 房间 走 到 另 一 个 房间 3 10s 
从 电梯 走 到 房间 4 10s 
从 房间 走 到 电梯 5 10s 
在 房间 内 6 输入 数据 
在 电梯 内 7 每 上 下 一 层 30s 
走出 大 楼 8 30s 


根据 行程 表 的 表示 要 求 ,每 个 事件 表示 为 具有 6 个 属性 的 Event 对 象 : 特派 员 代 码 
code(A 一 Z) .事件 类 型 type(0 一 8) 发生 时 间 begin、 延 续 时 间 Length ELI Hh from, A b 
地 点 to. HB. from 和 to 都 是 Room 对 象 。 

每 个 特派 员 都 有 一 个 由 若干 个 事件 组 成 的 行程 表 , 表 的 长 度 各 不 相同 ,所 以 组 织 成 链表 
是 合适 的 ,至 多 有 26 个 特派 员 , 所 以 可 组 织 成 一 个 元 素 为 链表 的 数组 schedules[A.. Z D 


管理 所 有 特派 员 的 行程 表 。 


为 了 模拟 各 特派 员 在 大 楼 内 的 行为 ,要 为 每 个 房间 和 电梯 设置 一 个 等 待 队 列 , 这 些 队 列 
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按 特派 员 的 优先 级 决定 出 队 的 顺序 ,所 以 应 该 是 优先 队列 。 共 有 10 层 楼 ,每 层 楼 有 11 个 房 
间 ( 包 括 一 个 电梯 ) ,设置 一 个 元 素 为 优先 队列 的 二 维 数组 gueues[1. .10,0..10]。 为 简化 算 
法 过 程 的 参数 ,可 以 把 这 两 个 数组 定义 成 全 局 量 。 

2) 事件 的 创建 与 行程 表 的 初始 化 

解决 本 问题 的 思路 是 先 根据 输入 文件 中 特派 员 的 行程 数据 创建 该 特派 员 整 个 行程 的 所 
有 事件 组 成 的 行程 表 , 将 其 中 的 等 待 事件 的 等 待 时 间 length 初始 化 为 0。 然后 根据 特派 员 
们 行程 中 事件 的 相互 影响 ,正确 地 加 以 调整 ,最 后 输出 调整 后 的 行程 表 。 为 每 个 特派 员 创 建 
行程 表 是 首先 需要 考虑 的 。 由 于 有 9 类 不 同 的 事件 ,所 以 需要 有 9 个 创建 事件 并 将 时 间 追 
加 到 行程 表 中 的 过 程 。 


ENTRY (code ,begin) 
WAIT-ELEVATOR (code begin, floor) 
WAIT-FRONT-ROOM(code „begin, room) 
ROOM-TO-ROOM(code s begin f rom to) 
ELEVATOR-TO-ROOM(code begin to) 
ROOM-TO-ELEVATOR (code s begin, f rom) 
IN-ROOM (code begin «length » room) 
IN-ELEVATORcCcode begin, floor, « floor; ) 
EXIT(code begins from) 


分 别 用 来 创建 进入 大 楼 VA P EL SE GEHE A, Ds 8] A A B T8] E $9] 53 — ^r Bs 8] , A A 3 fe] 
走 到 电梯 、 从 电梯 走 到 一 个 房间 、 在 房间 内 乘坐 电梯 和 离开 大 楼 事件 。 

这 9 个 过 程 中 ,除了 EXIT 过 程 可 能 会 调用 其 他 过 程 以 外 ,其 余 都 是 独立 地 生成 一 个 事 
件 并 将 其 初始 化 后 追加 到 代码 为 code 的 特派 员 行程 链表 schedules[code] 的 尾部 。 为 节省 
篇 幅 , 下 面 仅 列 出 ENTRY、WAIT-ELEVATOR 和 EXIT 的 伪 代 码 过 程 。 


ENTRY (code begin) 

1 codele]<code 

2 typele]--0 

3 beginLe]<begin 

4 lengthLe]<-30 

5 floorl f rom[e] ]*-0 ,number[ f rom[e]]-—0 
6 floor[ tole ]]<-0,number[ toL e] ]--0 

7 LiST-PUSH-BACK Gchedules[ code] +e) 

8 return begin[e]-- length e] 


WAIT-ELEVATOR (code, begin, floor) 

1 codele]<code 

2 typele]--1 

3 begin[e|<begin 

4 if begin MOD 5=0 

5 then length[e]<-0 

6 else Length[e]+-5- (begin MOD 5) 
7 floor from(e]]-— floor[tole]]< floor 
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8 number| from[e]]<-number[toLe]]<0 
9 LIST-PUSH-BACK Gchedules[ code] +e) 
10 tail<prev{ nill schedulesLcode]]1] 

11 ENQUEUE queues[ floorlto] 0] ,tail) 
12 return begin[e]-- length[e] 


ExIT(Ccode begin» f rom) 
1 code e]-—code 
2 typele]--8 


3 if floor[ from]71 DIEM 1 楼 离开 

4 then begin *- ROOM- TO-ELEVATOR( code » begin » f rom) 
5 begin<-WAIT-ELEVATOR (code » begin 1) 

6 begin*-IN-ELEVATOR(code begin, floorl from] ,1) 


7 beginLe]<begin 
8 lengthle]<-30 
9 fromLe]«— from 
10 floor[toLe]]*70 «number(toLe] ]--0 
11 LiST-PUSH-BACK Gchedules[ code] e) 
算法 3-18 创建 各 类 事件 的 过 程 


这 些 过 程 的 基本 工作 就 是 设置 事件 的 各 属性 初始 值 , 并 将 事件 追加 到 行程 链表 中 。 需 
要 注意 如 下 问题 。 

(1) 每 个 过 程 都 返回 本 事件 的 完成 时 间作 为 创建 下 一 个 事件 的 开始 时 间 的 参数 begin。 
决定 ENTRY 过 程 所 创建 的 进入 事件 的 开始 时 间 的 参数 begin 是 来 自 输入 文件 中 的 数据 。 

(2) WAIT-ELEVATOR 创建 等 待 电 梯 事 件 ,由 于 电梯 每 隔 5s 就 有 1 班 ,所 以 乘 上 电梯 
的 时 间 应 是 5 的 倍数 。 于 是 开始 时 间 若 不 是 5 的 倍数 , 则 等 待 时 间 应 初始 化 为 5 与 开始 时 
间 除 以 5 的 余数 之 差 , 这 样 就 可 以 在 电梯 到 达 时 乘 上 电梯 了 。 此 外 ,应 注意 该 过 程 创 建 的 等 
待 电梯 事件 (以 及 WAIT-FRONT-ROOM 创建 的 等 待 进入 房间 事件 ) 加 入 到 行程 链表 中 后 ,成 
为 链表 中 的 尾 结 点 , 需 将 此 结 点 加 入 到 相应 的 等 待 队 列 中 。 

(3) EXIT 过 程 需要 考虑 离开 大 楼 前 是 否 在 1 楼 ,如 果 不 是 从 1 楼 离开 的 , 则 需 调 用 
ROOM-TO-ELEVATOR 从 房间 走 到 电梯 .然后 调用 WAIT-ELEVATOR 等 待 电梯 ,还 需 调用 
IN-ELEVATOR 乘坐 电梯 到 1 楼 。 

利用 这 些 过 程 可 以 完成 对 输入 文件 中 特派 员 一 项 行程 数据 进行 预 处 理 的 过 程 。 在 输入 
文件 中 ,对 一 个 特定 的 特派 员 ( 由 起 点 信息 中 的 代码 code 决定 ) ,除了 起 点 信息 外 ,每 项 行程 
信息 仅 包含 2 个 数据 : 目的 房间 co 和 在 目的 房间 中 停留 的 时 间 length。 要 处 理 一 项 信息 还 
需要 2 个 信息 : 起 点 地 点 from 和 起 始 时 间 begin。 这 两 个 信息 都 来 自 于 上 一 个 加 入 行程 表 
的 事件 e: 目的 地 xzo[e] 和 起 始 时 间 与 延续 时 间 之 和 begin[Le] 十 length[e]。 用 TO-ROOM 过 
程 来 处 理 特派 员 code 的 一 项 行程 信息 ,该 过 程 的 参数 除了 代码 code 以 外 ,还 包含 来 自 于 上 
一 项 信息 处 理 结果 的 起 点 from 开始 时 间 begin 以 及 本 项 信息 中 的 延续 时 间 length 和 目标 
地 点 to。 


TO-ROOM(code,begin, length, f rom «to) 
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1 if floor[ from]= floor[to] DAE 

2 then if(number[ from ]750? 上 > 非 来 自信 口 

3 then begin«- ROOM- TO-ROOM code begin, f rom «to) 

4 else if number[ from ]750 

5 then begin -ROOM-TO-ELEVATOR( code begin, from) 

6 begin< W AlT-ELEVATOR (code begin, floor[ from]? 

7 begin*-IN-ELEVATOR(code begin, floor[ from], floor[to]) 
8 begin<-ELEVATOR-TO-ROOM(code ,begin,t0) 

9 begin*-W AIT-FRONT-ROOMc( code : begin to) 


10 return IN-ROOM(code , begin, length ,to) 


算法 3-19 处理 一 项 行程 数据 的 伪 代 码 过 程 


该 过 程 首 先 分 别 对 本 项 行程 信息 中 起 点 与 终点 是 否 在 同一 层 楼 进行 不 同 的 处 理 。 如 果 
起 点 与 终点 在 同一 层 且 起 点 是 从 同 层 的 另 一 房间 , 则 调用 ROOM-TO-ROOM 过 程 ,加 入 一 个 
从 房间 from 走 到 房间 4o 的 事件 。 起 点 与 终点 在 同 层 且 起 点 就 是 大 楼 入 口 , 由 于 进入 时 已 
计算 了 走 到 房间 的 时 间 , 所 以 省 略 ROOM-TO-ROOM 过 程 的 过 程 。 如 果 起 点 与 终点 不 在 同 
层 且 起 点 不 是 大 楼 入 口 而 是 一 房间 , 则 需 调用 ROOM-TO-ELEVATOR 过 程 ,加 入 一 个 从 房 
间 走 到 电梯 的 事件 。 起 点 与 终点 不 在 同 层 且 起 点 就 是 大 楼 入 口才 进入 大 楼 ,由 于 进入 时 已 
计算 了 走 到 电梯 的 时 间 , 所 以 省 略 ROOM-TO-ELEVATOR 过 程 的 调用 。 无 论 如 何 ,只 要 起 
点 与 终点 不 在 同一 层 , 都 需要 加 入 走 到 电梯 .等待 电梯 和 乘坐 电梯 的 事件 。 

然后 ,调用 WAIT-FRONT-ROOM 过 程 ,追加 一 个 在 终点 to 房 前 等 待 的 事件 ,最 后 调用 
IN-ROOM 过 程 , 追 加 一 个 留 在 终点 to 房 中 的 事件 。 

利用 ENTRY, TO-ROOM 和 EXIT 过 程 ,可 以 写 出 如 下 的 根据 输入 文件 中 包含 的 各 特派 
员 的 访问 行程 的 数据 创建 其 行程 表 的 算法 过 程 。 

INIT-SCHEDULES( f) 

1 read code,begin from f 

2 while code#".' 

3 do begin*-ENTRY(code begin) 
from<"0000" 
read to,length from f 
while to #0" 

do begin*- TO-ROOM(code begin , length , from to) 

from-to 

read to ,length from f 
10 ExIT(code begin, from) 
11 read code,begin from f 


算法 3-20 创建 所 有 特派 员 行程 表 的 伪 代 码 过 程 


输入 文件 含有 若干 个 特派 员 的 行程 数据 。 对 每 个 特派 员 ,行程 数据 由 若干 行 组 成 。 第 
一 行 包 括 两 个 信息 : 代码 code 和 以 hh:mm:ss 格式 表示 的 起 始 时 间 begiz。 然 后 ,若干 行 
关于 该 特派 员 的 行程 数据 ,每 行 包含 两 个 信息 ,以 zzyy 格式 表示 的 访问 的 房间 1o ,其 中 zz 
表示 楼 层 ,yy 表示 层 内 的 房 号 。 以 及 访问 该 房间 的 持续 时 间 length。 以 仅 含 数字 0 的 一 行 
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数据 作为 该 特派 员 行程 数据 的 结束 标志 。 整 个 文件 以 仅 含 字符 “. ”的 一 行 作为 结束 标志 。 
根据 文件 的 格式 ,过 程 首先 从 输入 文件 f 中 读 取 第 一 个 特派 员 的 代码 code 和 开始 时 间 
begin。 然 后 通过 第 2 一 11 行 的 while 循环 处 理 每 个 特派 员 的 行程 数据 。 其 中 ,第 3 行 调用 
ENTRY 过 程 向 行程 表 加 入 进入 大 楼 的 事件 ,返回 的 值 赋予 begin 作为 下 一 个 事件 的 开始 时 
间 。 第 4 行将 该 次 行程 的 起 点 的 from 置 为 特殊 值 0000, 表 示 刚 进入 大 楼 。 第 5 行 从 了 中 
读 取 特派 员 进 楼 后 的 第 一 项 行程 的 目标 房间 to 和 访问 持续 时 间 Length 58 6 一 9 行 的 while 
循环 处 理 该 特派 员 的 每 一 项 行程 数据 。 其 中 ,第 7 行 调用 TO-ROOM 过 程 处 理 该 项 行程 数 
据 ,返回 的 值 赋予 begin, 作 为 下 一 项 行程 的 开始 时 间 。 第 8 行将 本 次 的 目标 房间 to 赋予 
from ,作为 下 一 项 行程 的 起 点 房间 。 第 9 行 读 取 该 特派 员 的 下 一 项 行程 数据 。 一 旦 该 特派 
员 的 输入 数据 处 理 完 毕 ( 读 到 to 为 0) ,意味 着 他 /她 应 当 离开 大 楼 了 ,第 10 行 调用 EXIT 过 
程 在 行程 链表 中 加 入 离开 事件 。 

3) 行程 表 的 处 理 

为 了 模拟 各 位 特派 员 在 大 楼 中 的 活动 ,需要 做 如 下 控制 。 设 置 一 个 工作 矩阵 work- 
matriz[1..10,0..10], 用 来 跟踪 所 有 等 待 队列 上 一 次 出 队 的 队 首 。 模 拟 过 程 首先 选取 所 有 
等 待 队列 的 队 首 中 的 最 小 者 zx, 然后 通过 一 个 循环 逐一 对 目前 queues 的 各 队 首 的 最 小 者 x 
(假定 其 所 在 等 待 队列 为 gueues[i, 门 ) ,酌情 (与 work-matriz[i,j] 的 相关 数据 比较 ,看 是 否 
需要 等 待 ) 修 改 其 持续 时 间 lengih, 并 根据 对 它 的 修改 ,逐一 修改 该 事件 (从 属于 某 个 特派 
员 ) 所 在 行程 链表 中 其 后 的 每 个 事件 的 开始 时 间 ,如 果 这 样 的 事件 处 于 某 等 待 队 列 中 则 需 维 
护 该 队列 的 堆 性 质 。 然 后 ,将 交 给 work-matriz[i, 门 作为 下 一 次 对 gueues[i,j] 中 出 队 的 
队 首 作 比 较 用 。 并 从 x 所 在 的 等 待 队列 中 ,将 其 弹出 ,这 样 的 操作 循环 往复 ,直至 queues 中 
所 有 队列 为 空 。 


PROCESS-SCHEDULES() 

1 allocate work-matriz[1..10,0..10] and set work-matrix[i,j] to NIL 

2 z<—MINI(gueues) 

3 while zz^ NIL 

4  doi--floorLtoLkeyLx]]] j*7numberL toL key Lx 1]]* flag false 

5 if work-matrix[i.j ]ANIL Dax 非 等 待 队列 第 1 个 出 队 的 事件 
6 then p<x,q~-work-matrix[i,j] 

7 if type[ey[ x]]—1 DIR 是 等 待 电梯 的 事件 

8 then if begin( key p]]—begin[key[q]] 

9 then Zength[key[ p] ]--length[ ey p1]4- 5 


10 flag<true 

11 if type[key[x]]=2 bd x 是 等 待 进 入 房间 的 事件 
12 then t1 begin key p1]-- length key 91] 

13 t; 7 begin[ key next[ q]]] - length key U next 4111 

14 if ti <t, 

15 then length[key[ p] ]--ength[key[ p1]-- t; — ti 

16 flag~true 

17 if flag=true 

18 then begin~begin[ keyl p] ]-- lengthLkey C11 

19 p--nextL p] 
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20 while pA NIL 户 修改 行程 表 中 p 及 其 后 事件 的 开始 时 间 
21 do begin[key[p]]<begin 

22 if type[key[p]]=1 

23 then t=—(begin[keyLp]]+lengthLkeyLp]]) MOD 5 

24 if 750 

25 then length[key[ p]]<5-t 

26 else length[keylp]]<-0 

27 if type[ keyL p1]—1 or typelkeyLp1]—2 

28 then FIX (queues[ floor( to[ key p]]] number[ toL keyC p1]1) 
29 begin*-beginL key p]]+length[keylp]] 

30 p--nextLp] 

31 work-matriz[i,j]*—x 

32 DEQUEUE(queues[ i,j ]) 

33 x*-MINICqueues) 


算法 3-21 模拟 特派 员 在 大 楼 中 活动 处 理 行程 表 的 过 程 


过 程 PROCESS-SCHEDULES 的 工作 如 下 。 

首先 将 work-matrix 的 所 有 元 素 置 为 空 (NIL)。 第 2 行 调用 过 程 MINI 计算 queues 中 
各 队列 的 队 首 最 小 者 并 返回 给 工 。 第 3 一 33 行 的 while 循环 模拟 整个 大 楼 中 特派 员 的 活动 。 
该 循环 的 每 次 重复 分 别 对 等 待 电梯 和 等 待 进入 房间 的 事件 进行 处 理 。 其 中 ,第 4 行 计 算 工 所 
在 等 待 队列 的 下 标 和 j。 第 5 行 测试 x 是 否 为 该 等 待 队列 第 1 次 出 队 的 事件 。 若 否 , 则 第 
6 一 30 行 对 于 其 进行 处 理 。 第 6 行 分 别 用 pq 指向 x 和 gueues[i, 门 的 前 一 个 出 队 的 队 首 ， 
它 保存 在 workmatrix[i j]. 5B 7—10 行 处 理 等 竺 电梯 的 事件 (type[Aey[z]]=1)。 当 
b 的 开始 时 间 和 本 队列 中 上 一 次 出 队 的 事件 g 的 开始 时 间 相 等 时 ,p 需要 多 等 5s。 第 11 一 
16 行 处 理 等 待 进入 房间 的 事件 (1ype[key[x]] 二 2)。 当 p 完成 时 间 小 于 g 的 下 一 个 事件 
Ca 从 属 的 特派 员 完 成 等 待 事 件 g 之 后 发 生 的 待 在 房间 中 的 事件 ) 的 完成 时 间 , 需 要 调整 p 的 
等 待 时 间 。 此 时 ,p EER nert [gj] 完成。 无 论 p 是 哪 种 类 型 的 事件 ,只 要 其 等 待 时 间 
length 发 生 了 调整 ,就 将 标志 flag (在 第 4 行 初始 化 为 false) ON true, 88 17 一 30 行 对 
b 发 生 了 等 待 时 间 调 整 的 情形 ,修改 p 从 属 的 特派 员 的 行程 链表 中 p 以 后 各 行程 事件 的 开 
始 时 间 。 注 意 , 当 处 理 的 是 等 待 电梯 事件 时 ,第 27 一 30 行 还 需 酌 情调 整 其 等 待 时 间 以 保证 
进入 电梯 的 时 间 是 5s 的 倍数 。 当 处 理 的 是 等 待 事件 (无 论 是 等 待 电梯 还 是 等 待 进入 房间 ) 
时 ,修改 开始 时 间 后 均 应 维护 所 在 等 待 队列 ,保持 优先 性 质 ( 第 27 行 和 第 28 行 )。 无 论 是 否 
需要 调整 zx 的 等 待 时 间 , 对 x 的 处 理 结束 后 ,第 31 行将 工 保留 到 zeorA-matriz[i 门 中 , 作 
为 队列 gueues[i,j] 中 下 一 个 队 首 比较 参照 事件 。 第 32 行将 zz M queuesLi j Iih 58 33 行 
重新 计算 queues 中 所 有 队 首 的 最 小 者 ,并 返回 给 zx, 作为 下 一 轮 的 处 理事 件 。 


3. 程序 实现 


1) 数据 类 型 设计 及 全 局 量 设置 

根据 对 问题 中 涉及 的 房间 .事件 .事件 组 成 的 行程 表 、 模 拟 特派 员 在 大 楼 内 活动 时 电梯 
和 房间 前 的 等 待 队列 的 说 明 以 及 事件 间 的 比较 规则 ,有 如 下 类 型 定义 .数据 声明 及 函数 
定义 。 
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1 typedef struct( /* 房间 类 型 */ 

2 int floor; /* 楼 层 */ 

3 int number; /* 房间 号 */ 

4 ) Room; 

5 typedef struct( /* 事件 类 型 */ 

6 char code; /* 特派 员 代码 * / 

7 inttype; /* 事 件 类 型 */ 

8 Room from; /* 起 点 房间 */ 

9 Room to; /*#* 终 点 房间 * / 

10 int begin; / * 开始 时 间 * / 

ll int length; / * 持续 时 间 * / 

12 } Event; 

13 PQueue * queues[ 11][ 11]; / * 电梯 与 房间 等 待 队列 * / 
14 LinkedList * schedules[ 26]; /* 各 特派 员 的 行程 表 * / 
15 FILE * fl, * f2; / 输入 输出 文件 * / 

16 int compare(ListNode **nodel ,ListNode **node2) ( /* 等 待 队列 中 事件 的 比较 * / 
17 Event * el —( * nodel)->key, * e2=( * node2)->key; /* 解 析出 结 点 所 含 事件 * / 
18 if(el->begin<e2->begin) / * el 的 开始 时 间 较 小 * / 
19 return 1; 

20 if(el->begin= —e2-»begin) / * 开始 时 间 相 等 * / 

21 return e2-»code-el-»code; 

22 return —1; 

23] 


程序 3-22 表示 房间 和 事件 的 数据 结构 


对 程序 3-22 的 说 明 如 下 。 

OD 第 1 一 4 行 和 第 5 一 12 行 分 别 定义 了 表示 房间 和 事件 的 数据 类 型 Room 和 Event, 
它们 的 属性 数据 的 意义 前 文 已 有 说 明 , 此 处 不 再 次 述 。 

(2) 第 13 行 声明 了 等 待 队列 和 矩阵 queues, 这 是 一 个 二 维 数组 ,共有 11 行 11 列 。 第 0 
列表 示 各 层 电梯 的 等 待 队列 ,. 即 queues[i][0] 表 示 第 i 层 楼 的 等 待 电 梯队 列 ,i 二 1,2,… ,10。 
由 于 没有 第 0 层 , 所 以 queues[L0J[j],j 二 0,1,…,10 弃 之 不 用 。 这 个 数组 的 元 素 类 型 是 本 节 
开发 的 基于 堆 的 通用 优先 队列 指针 PQueue * 。 第 14 行 声 明了 行程 链表 数组 schedules, 
每 个 特派 员 在 大 楼 中 的 活动 均 按 其 行程 表 进行 .由 于 一 天 最 多 有 26 个 特派 员 进 入 大 楼 ,所 
以 该 数组 共有 26 个 元 素 。 元 素 类 型 是 第 2 章 开发 的 通用 双向 链表 指针 LinkedList * 。 第 
15 行 声明 了 两 个 文件 指针 {1 和 他 ,表示 程序 的 输入 输出 文件 。 

(3) 在 等 待 队列 queues[ 订 [中 ,事件 之 间 需 要 进行 比较 。 第 16 一 23 行 定义 的 函数 
compare 对 两 个 双重 指针 el 和 e2 指引 的 事件 按 题 面 说 明 的 规则 比较 大 小 ,用 于 行程 链表 
中 结 点 比较 。 等 待 队 列 中 的 事件 之 所 以 需要 用 双重 指针 指引 ,是 因为 它们 是 所 从 属 的 链表 
中 的 结 点 ,一旦 在 处 理 过 程 中 开始 时 间 被 修改 ,就 应 该 反映 在 其 等 待 队列 中 的 优先 级 。 用 双 
重 指针 表示 链表 中 的 数据 与 等 待 队列 中 的 数据 的 这 种 关联 关系 。 

2) 初始 化 行程 表 

要 解决 本 问题 首先 要 根据 输入 文件 中 各 特派 员 的 行程 数据 创建 他 们 的 行程 表 , 而 行程 
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表 是 由 一 系列 的 事件 按 事件 顺序 排列 而 成 的 。 在 程序 中 需要 实现 算法 3-18 至 算法 3-20 来 
完成 这 一 任务 。 为 节省 篇 幅 , 下 面 仅 列 出 创建 进入 大 楼 事件 、 创 建 电 梯 等 待 事件 及 创建 行程 
K 3 个 过 程 的 实现 代码 并 加 以 解析 。 其 他 的 创建 事件 的 函数 代码 读者 可 打开 源 文件 自行 


解读 。 
1 int entry(char code,int begin) { /* 进 入 大 楼 x*/ 
2 Event e= {code,0,{0,0},{0,0}),begin,30}); 
3 schedules[code—'A']=createList(sizeof (Event), NULL) ; 
4 listPushBack(schedules[code—'A'], &-e) ; 
5 return e. begin 十 e. length; 
6) 
7 int waitElevator(char code, int begin, int floor) ( /* 等 待 电梯 * / 
8 Event e= ({code,1,{floor,0} , {floor,0} ,begin,begin%5?5-begin%5:0}; 
9 listPushBack(schedules[code—'A'], &.e); 
10 if(queues[floor][0]==NULL) 
11 queues[floor][0]= initPQueue(sizeof (ListNode * ) ,26 , compare) ; 
12 enQueue(queues[ floor ][0], &-Cschedules( code—'A‘]->nil->prev)) ; 
13 return e. begin+e. length; 
14 } 
15 void initSchedulesO ( 
16 char codes room[5 J. floor 3]; 
17 int hour, minute, second, length, begin; 
18 Room from, to; 
19 /* 读 入 特派 员 代 码 及 来 到 大 楼 的 时 间 / 
20 fscanf(f1,"%e %d: %d: %d", &-code, &-hour, & minute, &-second) ; 
21 while(code! =". ') ( 
22 begin= hour * 3600+ minute * 60+second; /* 换 算 开 始 时 间 * / 
23 begin=entry(code, begin) ; / * 创建 并 在 行程 表 中 加 入 进入 大 楼 事件 * / 
24 from, floor 一 1,from. number— 0; 
25 ÍscanfCf1, 94s %d", room, &-length) ; /* 读 入 该 特派 员 下 一 项 行程 数据 * / 
26 to. floor=atoi(strncpy(floor,room,2)); /* 解 析 目 标 房间 楼 层 */ 
27 to. number 一 atoi(strncpy(floor,room 十 2,2)); /x 解析 目标 房间 号 码 */ 
28 while(strlen(room) 7D ( 
29 begin— toRoom(code: begin. length. from. to); / * 处 理 一 项 行程 数据 * / 
30 from— to; /* 设 置 下 一 项 起 始 地 点 * / 
31 ÍscanfCf1, 4s % d", room, &-length) ; /* 读 取 下 一 项 行程 数据 * / 
32 to. floor= atoi(strncpy(floor, room,2)); 
33 to. number= atoi(strncpy(floor, room+2,2)); 
34 } 
35 Exit(code, begin, from) ; / * 该 特派 员 离 开 大 楼 * / 
36 /* 读 取 下 一 个 特派 员 的 数据 */ 
37 fscanf(f1,"%e % d: %d: Vid". & code, & hour. & minute, &-second) ; 
38 ) 
39 } 


程序 3-23 ”创建 行程 表 的 C 函数 
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对 程序 3-23 的 说 明 如 下 。 

COD 第 1—6 行 定义 的 函数 entry 实现 算法 3-18 中 的 ENTRY 过 程 。 由 于 把 事件 表示 为 
结构 体 对 象 ,C 中 结构 体 变量 是 可 以 初始 化 的 ,所 以 初始 化 事件 e 的 代码 甚至 比 伪 代 码 还 简 
Wi: 第 2 行 等 价 于 算法 过 程 中 第 1 一 6 行 整整 6 行 。 由 于 进入 大 楼 事件 是 特派 员 code 的 行 
程 表 中 的 第 一 个 事件 ,所 以 第 3 行 调用 函数 ereateList? 为 schedules[code-'A] 创 建 一 个 空 
的 双向 链表 ,第 4 行 调用 函数 listPushBack 将 事件 e 追加 到 链表 schedules[ code — 'A"]ff 3k 
尾 。 注 意 ,code 的 值 为 人 一 Z', 故 code 一 'A' 对 应 0 一 26 。 

(2) 第 7 一 14 行 定 义 的 函数 waitElevator 实现 算法 3-18 中 的 WAIT-ELEVATOR 过 程 。 
由 于 等 待 电梯 事件 之 前 必 发 生 过 其 他 事件 (至 少 发 生 过 进入 大 楼 时 间 ) ,所 以 ,在 本 过 程 中 无 
须 创 建 链表 ,而 在 第 9 行 直接 将 初始 化 后 的 事件 e 追 加 到 链表 schedules[code—'A'] MAE. 
由 于 e 是 等 待 事件 , 故 须 在 第 12 行 调用 函数 enQueue? 将 其 所 在 的 链表 sched- 
ules[code 一 内 中 对 应 的 结 点 (尾部 结 点 schedules[code 一 'A]->nil->prev) 加 入 到 由 参数 
floor 确定 的 楼 层 的 电梯 等 待 队列 queues[floor]j[0] 中 。 不 过 由 于 这 是 第 一 次 在 该 队列 中 加 
入 元 素 , 故 第 10 行 和 第 11 行 先 检测 queues[ floor ][ 0 ]J& $$ Jy NULL, 若 是 , 需 先 调用 函数 
initPQueue 创建 一 个 优先 队列 。 

(3) 第 15 一 39 行 定义 的 函数 initSchedules 实现 算法 3-20 的 INIT-SCHEDULES 过 程 。 
由 于 把 输入 文件 定义 成 全 局 量 ,所 以 省 略 了 参数 {。 函 数 的 代码 与 算法 过 程 的 伪 代 码 结构 
十 分 接近 。 要 注意 的 情况 如 下 。 

D 从 输入 文件 读 取 的 开始 时 间 格 式 为 hh:mms:ss, 因 此 ,需要 在 第 22 行将 其 转换 成 以 
秒 为 单位 的 整数 begin, 

© 输入 文件 中 表示 房间 的 数据 格式 是 xxyy 的 串 , 所 以 第 26 行 和 第 27 行 (同样 的 第 32 
行 和 第 33 行 ) 通 过 调用 库 函 数 strncpy® 析 取 串 room 中 的 子 串 xx 和 yy, 并 调用 库 函 数 atoi 
将 它们 转换 成 整数 赋予 表示 目标 房间 的 Room 型 变量 to 的 floor 和 number 属性 。 

图 输入 文件 中 一 个 特派 员 行程 数据 的 结束 标志 是 仅 含 0 的 一 行 ,所 以 , 嵌 套 在 内 部 的 
第 28 一 34 的 while 循环 的 结束 条 件 是 strlen(room) = =1, 

3) 处 理 行程 表 

对 特派 员 们 在 大 楼 中 活动 的 行程 表 进 行 处 理 的 PROCESS-SCHEDULES 过 程 是 解决 
Department 问题 的 核心 。 下 列 函数 实现 该 过 程 。 


1 void processSchedules() { / * 处 理 行程 表 * / 

2  ListNode * workMatrix[11][11]= {NULL}; /< 工作 矩阵 * / 

3 int i,j; 

4 ListNode * x; 

5 while(x=mini(&-i, &j)){ 

6 ifCworkMatrix[ i] j D { /= 不 是 第 一 次 出 队 * / 

7 int flag=0; /* 维 持 时 间 调 整 标志 ,初始 化 为 false * / 
8 char code= ( (Event * ) (x->key) ) ->code; /* 确定 特派 员 * / 


C 此 处 的 函数 listPushBack 和 下 文中 的 函数 listPushBack 的 定义 见 第 2. 1. 3 节 的 程序 2-3 和 程序 2-4. 
© ”此 处 的 函数 enQueue 及 下 文中 的 函数 initPQueue 的 定义 见 3. 4. 2 节 的 程序 3-20 和 程序 3-19。 
© 此 处 的 库 函 数 strncpy 及 下 文中 的 库 函 数 atoi 的 原型 声明 都 在 头 文件 string.h 中 。 
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9 ListNode * p=x, * q=workMatrix[i][j]; 

10 if(( (Event * )(x->key))->type= =1){ / * 是 等 待 电梯 事件 * / 

11 Event * el— p-»key, * e2=q->key; 

12 if(el —-> begin= = e2-»begin) ( 

13 el->lenth=e2->lenth+5; 

14 flag=1; 

15 ) 

16 } 

17 if(((Event * )(x->key))->type= =2){ /* 是 等 待 进入 房间 事件 * / 

18 Event * el=p->key, * e2=q->next->key; 

19 int t1 — el-»begin-d- el -»lenth, /*#* 本 队列 本 次 事件 完成 时 间 / 

20 t2=e2->begin+e2->lenth; /* 上 次 事件 完成 时 间 * / 

21 if(t1<t2){ 

22 el->lenth+ =t2-tl; 

23 flag=1; 

24 ) 

25 ) 

26 ifCflag) ( / * 等 待 时 间 做 了 调整 * / 

27 Event * e=p->key; 

28 int begin=e->begin+e->lenth; /* 下 次 事件 的 开始 时 间 * / 

29 for(p=p->next,e=p->key;p!= schedules[code-'A]->nil; 
p=p->next,e=p->key){ 

30 e->begin= begin; / * 修改 开始 时 间 * / 

31 if(e->type==1){ /* 是 等 待 电 梯 事 件 * / 

32 int t=begin%5; 

33 e->lenth= t?5-t:0; 

34 } 

35 begin=e->begin+e->lenth; 

36 if(e->type==1 || e->type= —2) /* 是 等 待 事件 * / 

37 fix(queues[e->to. floor][e->to. number]); — / * 维护 所 在 等 待 队列 * / 

38 ) 

39 ) 

40 ) 


4l workMatrix[i][j]— xs 
42 deQueueCqueues( i][ 3) + 


程序 3-24 ”实现 行程 表 处 理 过 程 的 C 函数 


对 程序 3-24 的 说 明 如 下 。 

CD. 由 于 等 待 队列 队 首 最 小 者 x、 指 向 x 的 指针 p、 指 向 x 所 在 队列 queues[i][j] 上 一 次 
出 队 队 首 workeMatrix[i][jj] 的 指针 的 基 类 型 都 是 ListNode, 其 属性 key 才 指 向 某 个 事件 。 
为 使 代码 简洁 易 读 ,第 10 一 16 行 中 引入 指向 p.q 的 key 属性 的 指针 el、e2, 第 17 一 25 行 引 
入 指向 p、q->next 的 key 属性 的 指针 el 和 e2。 第 29 一 38 行 引 入 指向 p 的 key 属性 指针 e。 
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(2) 第 5 行 调用 函数 mini 计算 并 返回 各 等 待 队 列 中 队 首 的 最 小 者 给 x, 若 所 有 的 等 待 
队列 中 都 无 元 素 了 ,函数 返回 NULL。 所 以 ,可 以 将 此 赋值 表达 式 作 为 第 5~~43 行 的 while 
循环 的 循环 条 件 。 传 递 给 mini 函数 的 参数 是 变量 ij 的 地 址 ,mini 在 计算 等 待 队 列队 首 最 
小 者 的 同时 还 跟踪 最 小 者 所 在 队列 的 下 标 。 由 于 队列 构成 的 是 二 维 数组 , 主 调 函 数 可 通过 
这 两 个 参数 得 到 这 两 个 数据 。 这 样 就 免 去 了 算法 过 程 中 第 4 行 计算 xz 所 在 队列 下 标 i\j 的 
操作 。mini 函数 定义 如 下 。 

1 ListNode * mini(int * row,int * col) /* 计算 并 返回 各 等 队列 队 首 中 的 最 小 者 * / 

2 Event e= {'a',-1,{0,0}+{0,0},INT_MAX,.0}; /* 用 来 创建 链表 结 点 的 特殊 事件 * / 

3 ListNode n= (&e, NULL. NULL) , * x—&n; 

4 inti,j; 

5 for( * row=0,i=1;i<11;i++) 

6 — forj-0;j115j4-4-) 

7 if queues[ i] j 18. &. emptyCqueues[ i]Lj) & 8. 
compare(topCqueues[ i ]Lj D) ,&-x) >0){ / * queues[i][j] 的 队 首 小 于 x*/ 


8 x= * (ListNode**) (topCqueues( i][ j]) ; 

9 * row=i; / * 跟踪 x 所 在 队列 的 下 标 */ 

10 * col=j; 

11 ) 

12  if(* row) /* 有 效 的 最 小 值 * / 

13 return x; 

14 return NULL; / * queues 中 所 有 的 队列 均 为 空 */ 
15 } 


程序 3-25 计算 各 等 待 队列 队 首 最 小 者 的 C 函数 


(3) 程序 3-24 中 的 第 26 一 39 行 对 应 算法 3-21 中 第 17 一 30 行 , 对 某 等 待 事件 的 等 待 时 
间 做 了 变更 后 在 其 所 在 的 行程 表 中 以 后 结 点 修改 开始 时 间 的 操作 。 对 行程 表 中 所 处 理 的 每 
个 结 点 ,第 36 行 测 得 其 为 等 待 事件 时 ,由 于 它 的 优先 级 发 生 了 变化 ,需要 调用 函数 fix 对 其 
所 在 等 待 队列 维护 堆 性 质 。fix 函数 对 指定 优先 队列 的 保存 堆 的 数组 heap 调用 本 节 程 序 3-17 
中 定义 的 buildHeap 函数 ,重建 堆 。 其 定义 如 下 。 


void fix(PQueue * q){ 
buildHeap(q->heap,q->eleSize,q->heapSize,q->compare); 
) 


把 函数 fix 的 定义 添加 到 文件 夹 datastructure 的 源 文 件 pqueue. c 中 ,并 将 其 原型 声明 添加 
到 同一 文件 夹 内 的 头 文件 pqueue. h 中 。 已 备 今后 使 用 。 

4) 输出 行程 表 

对 处 理 好 的 各 个 特派 员 的 行程 表 , 用 下 列 函数 输出 。 


1 void printSchedules(){ 

2 inti; 

3 forGi=0;i<26;i++) 

4 if schedules i] ( 

5 fprintf(f2,"%c\n",'A'+i) ; 
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c6 0-30 


listTraverseCschedules[ i], printEvent) ; 
ÍprintfCf2, ^ n ; 

clrList(schedules[ i]. NULL) ; 
freeCschedules[i]) ; 


程序 3-26 输出 行程 表 的 C 函数 


函数 printSchedules 对 非 空 的 链表 schedules[ i 调用 listTraverse 对 其 进行 遍历 操作 。 


注意 ,传递 给 listTraverse 的 第 2 个 参数 是 遍历 链表 时 对 每 个 结 点 的 操作 函数 指针 
printEvent。 该 函数 负责 输出 结 点 中 所 含 的 事件 信息 。 定 义 如 下 。 
1 void printEvent(Event * e){ /* 输出 事件 * / 
2 int hour, minute, second, t=e->begin; 
3 ifCe->length==0) / * SERIE TA Os * / 
4 return; 
5 hour=t/3600;t=t% 3600; minute— t/60;second=t% 60; 
6 fprintf({2,"%02d: %02d:%02d ";hour,minute,second); /x 输出 开始 时 间 */ 
7 t=e->begin+e->length; 
8 hour=t/3600;t=t%3600;minute=t/60;second=t%60; 
9 fprintf({2,"%02d: % 02d: %02d "hour,minute,second); — / * 输出 完成 时 间 * / 
10 switch(e->type) { /* 按 事件 类 型 输出 相关 信息 * / 
ii case 0: fprintf({2,"Entry\n"); break; 
12 case 1: fprintfCÍ2, "Waiting in elevator queueVn? ; break; 
13 case 2: fprintf({2,"Waiting in front of room %02d%02d\n", 
e-»from. floor, e-»from. number) ; 
14 break; 
15 case 3:fprintí( 2, "Transfer from room %02d%02d to room %02d%02d\n", 
e-»from. floor. e-»from. number, e->to. floor. e-»to. number) ; 
16 break; 
17 case 4; fprintf({2,"Transfer from elevator to room %02d%02d\n", 
e->to. floor, e-»to. number) ; 
18 break; 
19 case 5 :fprintf(Í2, "Transfer from room %02d%02d to elevator\n", 
e->from. floor, e-» from. number) ; 
20 break; 
21 case 6; fprintf({2,"Stay in room %02d%02d\n", 
e->from. floor,e->from, number) ; 
22 break; 
23 case 7; fprintf({2,"Stay in elevator\n") ; break; 
24 case 8; fprintf({2,"Exit\n") ; 
25 ) 
26 } 


程序 3-27 输出 事件 信息 的 C 函数 
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该 函数 对 持续 时 间 length 大 于 0 的 事件 , 按 题 面 要 求 的 格式 向 输出 文件 输出 事件 信 
息 。 它 通过 一 个 switch 语句 ,对 不 同类 型 的 事件 ,输出 不 同 的 信息 。 

调用 函数 initSchedules processSchedules 和 printSchedules 解决 Department 问题 的 
main 函数 以 及 尚未 罗列 出 来 的 其 他 功能 函数 都 存储 在 文件 夹 chap03/Department 内 的 源 
文件 department. c 中 ,读者 可 打开 研读 
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数学 是 科学 的 皇后 ,计算 科学 当然 也 不 例外 。 计 算 科 学 不 但 以 数学 为 基础 ,并 且 以 解决 
数学 计算 问题 为 己任。 事实 上 ,无 论 是 科学 .技术 或 是 日 常生 活 , 人 们 无 时 无 刻 不 需 要 运用 
数学 的 知识 方法 解决 所 面临 问题 中 的 计算 。 计 算 机 是 计算 的 利器 ,使 用 计算 机 来 帮助 人 们 
解决 数学 计算 问题 是 实 至 名 归 。 

学 过 数学 的 人 都 知道 ,代数 和 几何 是 数学 学 科 的 基础 。 本 章 运用 第 3 音 讨 论 的 基本 算 
法 设计 策略 解决 代数 学 中 的 几 个 基本 问题 ,第 5 章 讨论 解决 计算 几何 中 的 几 个 经 典 问题 的 
算法 。 这 些 关 于 数学 的 算法 不 仅 本 身 侥 有 兴味 ,它们 也 是 本 书 以 后 各 章 所 要 解决 的 一 些 经 
典 问题 所 需 的 基础 算法 。 我 们 还 将 把 一 些 广泛 应 用 的 数学 计算 算法 实现 为 通用 的 程序 ,以 
备 调用 。 


4.1 矩阵 及 其 计算 


4.1.1 矩阵 与 向 量 


矩阵 是 由 数 构成 的 矩形 列 阵 。 例 如 ， 
be di; hi b 2 | 
A= 一 (4-1) 
azn d; üz 4 5 6 
是 一 个 2X3 矩阵 ,4=(o ) Er ji—1.2 R j 1.2.3 HEN i 1358 j 列 元 素 是 ay MK 
写字 母 表示 和 矩阵 并 用 对 应 的 带 有 下 标的 小 写字 母 表示 该 矩阵 的 元 素 。 元 素 为 实数 的 所 有 m 
Xn 矩阵 表 为 R”。 一 般 地 ,元 素 取 自 集 合 S 的 m Xn MSI Se. CETTE OLB, 
HERE A 的 行 数 和 列 数 表示 为 属性 rows LA ] RI columns LA ]. 
矩阵 4 的 转 置 是 由 A 的 行 ( 列 ) 转 换 为 列 ( 行 ) 而 得 的 矩阵 47 。 对 式 (4-1) 中 的 矩阵 4， 


1 4 
47 一 |2 5 
3 6 


实现 矩阵 转 置 的 算法 过 程 描述 如 下 。 


TRANSFORM(A) 

1 m-—rows[A ] n--columns[ A] 
2 for i<-1 tom 

3 do for j<-1 ton 

4 do A'[i,j]-- AUi] 
5 return AT 


算法 4-1 计算 矩阵 的 转 置 过 程 
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向 量 是 一 个 一 维 数组 。 例 如 ， 


(4-2) 


是 一 个 长 度 为 3 的 向 量 。 用 小 写字 母 来 表示 向 量 , 并 将 长 度 为 n 的 向 量 x 中 的 第 i 个 元 素 
表示 为 xz;,i 二 1,2,…,n。 把 等 价 于 一 个 nX1 和 矩阵 的 列 向 量 作为 标准 形式 ,而 相应 的 行 向 量 
是 对 列 向 量 取 其 转 置 而 的 : 

x? = (2,3,5) 

单位 向 量 e 是 第 i 个 元 素 为 1, 其 他 元 素 均 为 0 的 向 量 。 通常 ,单位 向 量 的 长 度 是 很 容 
易 由 上 下 文 而 知 的 。 

零 矩 阵 是 所 有 元 素 均 为 0 的 矩阵 。 这 样 的 矩阵 常 表示 为 0, 这 是 因为 它 与 数 0 之 间 的 
含混 很 容易 从 上 下 文 得 以 漆 清 。 若 0 表示 的 是 矩阵 , 则 其 规模 ( 行 数 与 列 数 ) 也 需要 从 上 下 
文中 推 得 。 

nXn 方 阵 是 常见 的 。 方 阵 的 几 种 特殊 情形 是 很 有 趣 的 。 

COD 对 角 阵 中 只 要 ij 就 有 oh 一 0。 由 于 非 对 角 线 上 的 元 素 均 为 零 ,可 以 用 对 角 线 元 
素 的 列表 来 表示 该 矩阵 : 


diag(an saz 9*** sam) = 
0 0 -** Gx 
(2) nXn 单位 阵 I, 是 对 角 线 上 元 素 均 为 1 的 对 角 阵 : 


1 0 € 0 
ô i oe 0 
I, = diag(1,1,…,1) = : / 
0 0 we 1 


当 单 位 阵 工 没有 下 标 表 示 时 ,其 规模 也 要 从 上 下 文中 推 得 。 单 位 阵 的 第 ; 列 是 单位 向 量 ei。 
(3) nX n 上 三 角 阵 避 中 , 若 ij 就 有 i 一 0。 对 角 线 以 下 所 有 元 素 均 为 0: 


0 0 ww i 
上 三 角 阵 中 若 对 角 线 上 的 元 素 均 为 1 , 称 为 单位 上 三 角 阵 。 
(D nXn 下 三 角 阵 工 中 , 若 ij 就 有 i; 二 0。 对 角 线 以 上 的 元 素 均 为 零 : 
ln 0 7 0 


la la c7 lm 
若 下 三 角 阵 的 对 角 线 元 素 均 为 1, 称 为 单位 下 三 角 阵 。 
(5) 置换 阵 己 中 的 每 一 行 或 每 一 列 仅 有 一 个 元 素 为 1, 其余 元 素 均 为 0。 置换 阵 的 一 个 
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例子 是 : 

0! LOO 

00010 

P=|1 0000 

00001 

00100 
之 所 以 把 这 样 的 矩阵 称 为 置换 阵 ,是 因为 将 其 与 一 向 量 x 相 乘 ,具有 将 * 09 76 38 HR CE 
排 ) 的 效果 。 


(6) 对 称 阵 A 满足 条 件 A 二 4”。 例 如 ， 


1 2 3 
2 6 4 
3 4 5 


矩阵 的 元 素 取 自 于 一 个 诸如 实数 系 、 复 数 系 ,或 以 素数 为 模 的 整数 数 系 。 数 系 中 定义 了 
数 的 加 法 和 乘法 ,可 以 把 包括 加 法 和 乘法 的 定义 扩展 到 和 矩阵 上 。 

AE XL RET D SR MUR. FF A= Cay) Al B= (o) SE mX n BI. WIE fr10958 Beda C— 
(cy) =A+B 定义 为 m Xn 矩阵: 


就 是 一 个 对 称 阵 。 


4.1.2 矩阵 的 运算 


cy = ag +b; 
i=1,2 esm Kj —1.2..n. WEED, E IAE TIO J A Je EUG RR EIT. D FC SERRE 
如 下 。 


MATRIX-ADD(A,B) 

1 m-row[A].n--colum[ A] 

2 if row[ B]*m or colum[ B]x*n 

3 then error "A,B 加 法 不 相 容 " 
4fori<ltom 

5 do for j<-1 ton 

6 do c; ay +; 

7 return C b C-(Gi)ux, 


算法 4-2 和 矩阵 的 加 法 过 程 


该 算法 的 运行 时 间 为 Gn. 
零 矩 阵 是 矩阵 加 法 的 单位 元 : 
A+0=A=0+A 
车 4 是 一 个 数 且 A 二 (a; ) 是 一 个 矩阵 , 则 AA = (Mai ) ,也 就 是 将 4 的 每 个 元 素 与 的 积 
构成 的 矩阵 称 为 4 的 标量 积 。 作 为 一 个 特殊 情形 ,定义 矩阵 A = Cay ) 的 负 阵 为 一 1 A= 
一 A, 即 一 4 i558 ij 个 元 素 是 一 a; FE 
A+(—A) =0=(—A)+A 
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根据 此 定义 ,人 们 把 矩阵 差 定 义 为 负 阵 的 和 : A 一 B 二 A 十 (一 B)。 

矩阵 积 的 定义 如 下 。 两 个 矩阵 4 和 B 是 乘法 相 容 的 , 若 A 的 列 数 等 于 B 的 行 数 (一 般 
地 , 若 表达 式 中 含有 矩阵 积 4B ,总 是 假定 此 意味 着 A 和 B 是 乘法 相 容 的) 。 若 A= Cay ) 是 
A mX n HRE, B= r)i nX p BE. WENER C= AB J& m X p HERE C= 
(ca) ,其 中 ， 

Cà 一 S abs (4-3) 

i 二 1,2,…,m 及 k= 二 1,2,*…,p。 下 列 的 过 程 MATRIX-MULTIPLY 实现 了 按 式 (4-3) 的 矩阵 
直接 乘法 。 

MATRIXMULTIPLY(A,B) 

1 if columns[ A] A rows[ B] 

2 then error "矩阵 乘法 不 相 容 ” 
3 else for i<-1 to rows[A] 
4 do for j<-1 to columnsL B] 
5 do C[i.j]--0 
6 for k<-1 to columns[ A] 
7 do C[i,j]-- Ci, j]- ALi£] * BLk,j] 
8 return C 


算法 4-3 JBIEAEIEIIE 
为 将 nX 矩阵 相 乘 ,MATRIXMULTIPLY 执行 到 次 乘法 和 到 (2 一 1) 次 加 法 ,所 以 其 运行 时 
间 是 8), 
矩阵 有 许多 (但 不 是 所 有 ) 与 数 相同 的 经 典 代数 性 质 。 单 位 阵 是 矩阵 乘法 的 单位 元 : 
对 任意 的 mXn HABE A 


LA = AI, =A 
3e VA EE e AE HE s 
A0 —0 
矩阵 乘法 是 结合 的 ,对 相 容 的 矩阵 A、B HC: 
A(BC) = (AB)C (4-4) 
矩阵 乘法 对 加 法 是 分 配 的 : 


A(B +C) = AB -- AC 
(B-- OA = BA - CA (4-5) 


XE n1 n X n AE MEER IEEE AY win. a-( MI oJ aB- 


ba Pa 1): 


矩阵- 向量 积 或 向 量 - 向 量 积 定 义 为 向 量 是 nX1 矩阵 (或 当 向 量 是 行 向 量 时 为 1 Xn E 
阵 )。 于 是 , 若 4 是 m Xn 和 矩阵 而 zx 是 长 度 为 n 的 向 量 , 则 Ax 是 长 度 为 m 的 向 量 。 若 x 和 y 
是 长 度 为 的 向 量 , 则 


xy 一 SI Ziyi 
ci 
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是 一 个 数 ( 即 为 1X1 和 矩阵) , 称 为 x FL y 的 内 积 。xy7 是 一 个 矩阵 Z, 称 为 x 和 y 的 外 积 ,其 
zy=zyj 长度 为 对 的 向 量 x( 欧 几 里 德 ) 范 数 | x | 定义 为 
lx = Gi aide -Gx, 


于 是 ,x 的 范 数 是 其 在 ” 维 欧 几 里 德 空间 中 的 长 度 。 


4.1.3 矩阵 的 性 质 


定义 一 个 nXn EEA FEE 0I — ^ n X n EE H A GETE) ,使 得 44 一 一 五 一 


A 4。 例如 ， 
1 下 7 ( 1 
h 0) a =i 


很 多 非 零 nox n RADA DE AG SE. — T BUG Eg BD a TRY. EF PE 
的 一 个 例子 是 
1 0 
(i 9) 


若 一 个 矩阵 有 道 , 称 其 为 可 逆 的 ,或 非 奇 异 的 。 如 果 一 个 矩阵 有 逆 , 则 其 逆 是 唯一 的 。 

若 A 和 B EIER EH n Xn ERE 
(BA)! = AB! (4-6) 
求 逆 运算 和 转 置 运算 是 可 交换 的 : 
(A)? = (A7)? 

向 量 组 x, ,xs，,… ,x, 是 线性 相关 的 , 若 有 一 组 不 全 为 零 的 系数 ees ,cv 使 得 X 十 
Coxa tet cx 一 0。 例 如 FT LAR x, (1.2.3 ),xs 二 (2,6,4), 和 x 二 (4,11,9) 是 线性 相 
XII 3 JS DAD 2-322 — 2a — 0. FAA ER EM KY WETTER EA KN. Hil 
如 ,组 成 单位 矩阵 的 各 列 向 量 就 是 线性 无 关 的 。 

AEA mx n 矩阵 4 的 列 秩 是 其 列 向 量 的 最 大 线性 无 关 组 中 的 向 量 个 数 。 类 似 地 ,4 的 
行 秩 是 其 行 向 量 的 最 大 线性 无 关 组 中 的 向 量 个 数 。 任 一 矩阵 A 的 一 个 基本 性 质 是 其 行 秩 
总 是 等 于 其 列 秩 , 因 此 可 以 直接 引用 4 的 秩 。 一 个 痉 X7 和 矩阵 的 秩 是 一 个 介 于 0 与 min(m,n) 
之 间 的 整数 ( 零 矩 阵 的 秩 是 0, 单 位 阵 的 秩 是 n)。 非 零 mox n 矩阵 A 的 秩 的 另 一 个 等 价 并 且 
是 更 有 用 的 定义 , 它 是 使 

A= BC 

WJ m X r EREB 和 rrXn 和 矩阵 C 的 最 小 整数 ~。 

一 方 阵 具有 满 秩 , 若 其 秩 为 n。 一 mox n AAA RAK ABN n. PIPE 
性 质 由 下 列 定理 给 出 。 

定理 4-1 一 方 阵 具有 满 秩 当 且 仅 当 它 是 非 奇异 的 。 

矩阵 A 的 零 向 量 是 一 个 非 零 向 量 x 使 得 Ax 二 0。 下列 的 定理 及 其 推论 揭示 了 列 秩 概 
念 . 奇 异性 与 空 向 量 的 关系 。 

定理 4-2. 和 矩阵 A 具有 满 列 秩 当 且 仅 当 它 没有 零 向 量 。 

推论 4-1 方 阵 4 是 奇异 的 当 且 仅 当 它 有 和 零 向 量 。 

nXn(n>1) 584 A f858 ij 子 阵 Atjj 是 一 个 (n 一 1) X (2z 一 1) 和 矩阵 , 它 是 删 掉 A 的 第 i 


173 


从 算法 到 程序 (第 2 NO 


行 .第 j 列 而 得 到 的 。nXn EEA 的 行列 式 利用 它 的 子 阵 递归 定义 如 下 : 


ay n=1 


det(A) = (4-7) 


ME nD'Uagde(Ang) n>1 
j=l 


TH — D? det (Ay D AIR as RAF. 


下 列 两 条 定理 表达 了 行列 式 的 基本 性 质 ,它们 的 证 明 在 此 忽略 。 

定理 4-3( 行 列 式 性 质 ) 方 阵 A 的 行列 式 有 如 下 性 质 。 

A) A 的 任 一 行 或 任 一 列 为 零 , 则 det(A)=0. 

(2) E A 的 一 行 (或 一 列 ) 的 所 有 元 素 乘 以 4, 则 其 行列 式 乘 以 4。 

(3) 若 将 4 的 一 行 (或 一 列 ) 的 元 素 加 到 另 一 行 (或 男 一 列 ) 的 对 应 元 素 上 ,行列 式 不 变 。 
OD A 的 行列 式 等 于 47 的 行列 式 。 

(5) 若 交换 A 的 两 行 ( 或 两 列 ) ,行列 式 乘 以 一 1。 

此 外 ,对 任意 的 方 阵 4 HIB, H det(4B) 王 det(4)det(CB) 。 

定理 4-4 n X n ABE A 是 奇异 的 当 上 且 仅 当 det(A)=0. 


4.1.4 矩阵 的 程序 实现 


174 


1. 数据 类 型 的 定义 
首先 ,需要 定义 矩阵 的 数据 类 型 以 及 对 矩阵 进行 创建 .空间 清理 等 维护 的 函数 。 


1 typedef struct{ /*#* 和 矩阵 类 型 定义 * / 
2 double * tab; /[* HR / 

3 int row, col; /* 行 数 、 列 数 * / 

4 )Matrix; 

5 Matrix newMatrix(int m,int n){ /* 生 成 0 和 矩阵 * / 

6 Matrix a; 

7 assert(m>=0%&&n>=0); 

8 a. row=m; a. col=n; 

9 assert(a, tab— (double * )calloc(m * n,sizeof(double) )) ; 

10 return a; 

1) 

12 Matrix newMatrixByArry(double * a.int m.int n) ( / * 用 数组 数据 生成 矩阵 / 
13 Matrix b— newMatrix(m.n) ; 

14 memcpy(b. tab,a,n * m * sizeof( double?) ; 

15 return b; 

16 ) 

17 void clrMatrix Matrix a) { /* 清理 矩阵 空间 * / 
18  free(a. tab); 

19 } 


程序 4-1 PRM LR EP aR 
程序 4-1 的 说 明 如 下 。 


第 4 章 代数 计算 


CD 第 1 一 4 行将 矩阵 定义 为 具有 3 个 属性 的 结构 体 类 型 Matrix。int 型 属性 row 和 
col 分 别 表示 和 拖 阵 的 行 数 和 列 数 。double 型 指针 属性 tab 表示 和 抢 阵 的 二 维 数 表 。 之 所 以 用 
一 维 指针 表示 二 维 数 表 , 出 于 两 个 方面 的 考虑 : 首先 ,为 一 维 指针 分 配 存储 空间 的 代码 比较 
简洁 。 其 次 ,计算 一 维 数组 元 素 下 标 比 计算 二 维 数组 元 素 下 标的 效率 高 。 我 们 约定 : 按 行 
优先 原则 将 二 维 数 表 存 储 于 一 维 数组 中 。 

(2) 第 5—11 行 定义 的 函数 newMatrix 用 两 个 int 型 参数 m A n 创建 一 个 mxXxn figs 
阵 , 作 为 函数 值 返回 。 由 于 第 9 行 调用 动态 内 存 分 配 函数 calloc, 创 建 的 矩阵 数 表 元 素 被 初 
始 化 为 0, 所 以 创建 的 是 一 个 上 xn 的 0 和 矩阵 。 

(3) 第 12—16 行 定义 的 函数 newMatrixByArry 用 参数 aCdouble 型 指针 指引 的 数组 ) 
中 的 数据 ,创建 一 个 由 参数 m、n 确定 行 数 和 列 数 的 矩阵 ,作为 返回 值 返回 。 使 用 该 函数 需 
要 注意 的 是 ,a 中 数据 应 按 行 优先 原则 存储 矩阵 的 数据 。 例 如 ,用 数组 aL 9 J = {1,2,3,4,5， 
1 2 3 
4. 5 6]. 
7 8 9 

(A) 第 17 一 19 行 定义 的 函数 clrMatrix 对 Matrix 型 参数 a 的 table 属性 指引 的 动态 空 
间 执 行 free 操作 。 对 行将 丢弃 不 用 的 Matrix 型 变量 ,应 调用 该 函数 释放 占用 的 存储 空间 ， 
以 防 内 存 泄漏 。 


2. 矩阵 运算 实现 
定义 了 Matrix 类 型 后 ,用 如 下 的 函数 实现 算法 4-1 至 算法 4-3。 


6,7,8,9) ,调用 newMatrixByarry(a,3,3) 创 建 矩 阵 


1 Matrix transform( Matrix a) ( /* 计 算 矩 阵 的 转 置 * / 
3 int i,j, m=a. col,n= a. rows 

2 Matrix at=newMatrix(m,n); 

4 forGi=0;i<m;i ++) 

5 for(j—0;j—nijd- +) 

6 at. tab[i * n+j]=a. tab[j * m+i]; 

7 return at; 

8j 

9 Matrix matixAdd( Matrix a, Matrix b){ / * PERI * / 
10 Matrix c; 

11 int i,j,m 一 a. row. n- a. col; 

12 assert( b. row— — m8.&b. col= =n); 

13 c— newMatrix(m,n) ; 

14 for(i=0;i<m;i++) 

15 for(j—0;j—n;jd- 3-) 

16 c. tab[i * nt-j]—a. tab[i * n--j]-- b. tab[i * nj]; 
17 return c; 

18 ) 


19 Matrix matrixMultiply Matrix a» Matrix b) ( / * SBEERISE * / 
20 Matrix c; 
21 int i,j,k; 
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22 assert(a, col 一 一 b. row) ; 

23 c 一 newMatrix(a. row. b. col) ; 

24 for(i=0;i<a. row;it +) 

25 for(j=0;j<b. col;j 十 十 ) 

26 for(k=0;k<a. col;k+ +) 

27 c. tab[i * c. col+j]+ =a. tab[i * a. col 十 k] * b. tab[k * b. col+j]; 
28 return c; 

29 } 


程序 4-2 实现 矩阵 加 法 和 乘法 运算 的 函数 


程序 4-2 的 说 明 如 下 。 

CD 第 1 一 8 行 定义 的 函数 transform 实现 算法 4-1, 计 算 Matrix 型 参数 a 的 转 置 矩 阵 
作为 函数 值 返回 。 函 数 代 码 与 算法 伪 代 码 的 结构 非常 近似 , 仅 指出 第 6 行 中 对 at 的 第 i iT 
第 j 列 元 素 的 访问 形式 是 at. tab[i * n 十 让 ,而 对 a 的 第 j 行 第 i 列 元 素 的 访问 形式 为 
a. tab[j * m 十 襄 , 这 是 用 一 维 数 组 按 行 优先 原则 存储 二 维 数 组 时 ,由 下 标的 换算 关系 决 
定 的 。 

(2) 第 9 一 18 行 定义 的 函数 matixAdd 实现 算法 4-2 ,执行 Matrix 型 参数 a Al b 的 加 法 
将 和 作为 函数 值 返回 。 第 12 行 调用 库 函 数 assert. 保证 和 矩阵 a Al b 的 行 数 和 列 数 相同 。 
第 14 一 16 行 的 两 重 for 循环 实现 算法 4-2 中 的 第 4 一 6 行 的 两 重 for 循环 。 请 注意 用 一 维 数 
组 按 行 优先 原则 存储 二 维 数组 时 对 各 和 矩阵 元 素 的 访问 形式 。 

(3) 第 19 一 29 行 定义 的 函数 matrixMultiply 实现 算法 4-3, 计 算 Matrix 型 参数 a 和 b 
的 乘法 ,并 将 积 作 为 函数 值 返 回 。 第 22 行 调用 库 函 数 assert 保证 矩阵 a、b 是 乘法 相 容 的 。 
函数 的 代码 与 算法 伪 代 码 的 结构 十 分 近似 ,读者 可 比较 研读 。 

程序 4-1 和 程序 4-2 中 定义 的 数据 类 型 和 各 函数 的 原型 声明 保存 在 文件 夹 algebra 中 的 头 
文件 matrix. h 中 ,函数 定义 则 保存 在 同一 文件 夹 的 源 文件 matrix. c 中 ,以 备 在 应 用 中 调用 。 

应 用 中 可 能 还 要 进行 矩阵 间 的 减法 运算 , 即 两 个 行 数 、 列 数 相同 的 矩阵 对 应 元 素 进行 减 
法 运算 得 到 的 结果 称 为 两 者 之 差 。 很 容易 比照 算法 4-2 写 一 个 矩阵 相 减 的 算法 ,我 们 已 将 
其 实现 为 函数 matrixDiff ,保存 于 matrix. c 中 (原型 声明 于 matrix. h 中 ) ,读者 可 打开 文件 
研读 。 


4.2 和 矩阵 的 LUP 分 解 


在 各 种 应 用 中 经 常 要 解 一 组 联 立 的 线性 方程 。 本 章 仅 讨论 具有 个 未 知 数 zl yza，…， 
Zs 的 线性 方程 组 : 


And Hart 十 … + aye, = by 
an Hazas 十 … + dint = bz 

(4-8) 
An Xi Hantz d tt basa, = b, 


同时 满足 方程 组 的 一 组 zi ,zz ent en, 值 称 为 该 方程 组 的 一 个 解 。 
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线性 方程 组 可 以 表示 成 一 个 矩阵 方程 .其 中 的 每 个 矩阵 或 向 量 都 属于 某 个 数 域 ,通常 是 
实数 域 R。 可 以 方便 地 将 式 (4-8) 表 示 为 矩阵 -向 量 方程 : 


ay ar Qin )( 21 bı 
an ax aw || £2 | b, 
adm Ann 7t Am X. b, 
或 等 价 地 , 设 A— (laj) x= Gr b= GD BR: 
Ax —b (4-9) 
其 中 ,A 称 为 式 (4-8) 的 系数 矩阵 。 若 4 是 非 奇异 的 , 它 具 有 逆 A. W 
x—A'b (4-10) 


是 解 向 量 。 可 以 证 明 此 x 是 式 (4-9) 唯 一 的 解 。 车 有 两 个 解 x 和 x SU Ax—Ax'—b H. 
x = (A'A)x = AT (Ax) = Ax) = (A7A)x = x 

我 们 主要 讨论 A 是 非 奇 异 或 ( 按 定理 4-1)4 的 秩 等 于 未 知 数 个 数 的 情形 。 代 数 中 通 
常用 Gaussian 消去 法 解 此 线性 方程 组 。 首先 从 各 方程 减 去 第 1 个 方程 的 倍数 ,使 得 这 些 方 
程 的 第 一 个 变量 被 移 除 。 然 后 从 第 3 个 方程 起 ,各 方程 减 去 第 2 个 方程 ,使 得 在 这 些 方程 中 
消去 第 1 个 变量 和 第 2 个 变量 。 这 些 操作 对 应 于 对 系数 矩阵 A 做 对 应 的 操作 : 将 某 一 行 的 
若干 倍加 到 另 一 行 。 继 续 这 一 进程 ,直至 得 到 一 个 上 三 角形 式 矩 阵 U。 而 为 消去 各 变量 的 
倍数 行 构成 的 矩阵 工 是 下 三 角形 的 。 将 此 方法 转换 成 对 系数 矩阵 的 变换 ,就 是 在 本 节 中 讨 
论 的 对 矩阵 的 LUP 分 解 。 


4.2.1 LUP 分 解法 概述 


Xf nX n BI A ,LUP 分 解法 是 求 3 个 nXn 和 矩阵 LU 和 P 使 得 : 

PA=LU (4-11) 

其 中 : 

(1) 工 为 一 单位 下 三 角 和 矩阵 。 

(2) U 为 一 上 三 角 和 矩阵 。 

(3) 了 为 一 置换 矩阵 。 

称 满足 式 (4-11) 的 矩阵 LU 和 PP HEREA 的 一 个 LUP 分 解 。 我 们 将 证 明 任 一 非 奇 异 矩 阵 
A 都 具有 这 样 的 分 解 。 

对 矩阵 A 进行 LUP 分 解 的 好 处 在 于 线性 方程 组 在 矩阵 L 和 U 为 三 角 阵 时 , 解 起 来 很 
方便 。 对 A 做 LUP 分 解 后 ,可 以 通过 如 下 只 解 三 角形 线性 方程 组 来 解 方程 Ax =b, 
在 Ax— b 的 两 边 乘 以 P 得 到 方程 PAx = Pb. 3x 4H 24 TF 0837; Fe 4 (4-80. IHE A fi 
XO-1D ,有 

LUx — Pb 

现在 可 以 通过 解 两 个 三 角形 线性 方程 组 来 解 此 方程 。 设 y= 二 Ux ,其 中 x 是 要 求 的 解 向 
量 。 首 先 ,用 称 为 “前 代 法 ?的 方法 解 下 三 角形 方程 组 : 

Ly — Pb (4-12) 
得 到 未 知 数 向 量 y, 然 后 用 称 为 “ 回 代 法 ”的 方法 解 上 三 角 线性 方程 : 
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Ux — y (4-13) 
得 到 原 方程 组 Ax — b 的 解 向 量 x。 这 是 因为 置换 矩阵 P Ii np EY 
Ar=P'IUx=PLy=PPb=b 


4.2.2 LU 分解 


下 面 先 讨论 简单 的 情形 : ERE A 的 主 对 角 线 上 的 元 素 在 分 解 过 程 中 永 不 为 0, 这样 就 


不 需要 交换 各 行 而 省 略 了 置换 矩阵 已 。 这 样 的 操作 称 为 LU 分 解 。 实 现 此 策略 的 算法 是 递 
VAIS, SEX nXndES SÓBIEA 构造 其 LU 分 解 。 若 "一 1, 则 计算 完成 ,这 是 因为 可 以 选取 
工 一 石和 U=4A。 对 7 一 1, 将 4 分 割 成 4 个 部 分 : 


an i aiz Ain 


其 中 vv 是 一 个 长 度 为 (n 一 1) 的 列 向 量 ,w" 是 一 个 长 度 为 (n 一 1) 的 行 向 量 ,A' 是 一 个 (n 一 1) X 
(n 一 1) 和 矩阵 。 然 后 ,直接 验证 乘积 可 知 ,A 可 以 分 解 因子 : 


an w 1 0 \(an w 
A= ,|= F (4-14) 
v A v/an Ta) 0 A'— vw'/ay 


因子 分 解 的 前 后 矩阵 中 的 0 分 别 是 长 度 为 2 一 1 的 列 向 量 和 行 向 量 。 项 vw /an 是 将 。 
Be w 的 外 积 除 以 an 而 得 的 (2 一 1)X (一 1) 和 矩阵 , 它 与 被 其 所 减 的 矩阵 A’ 的 规模 是 一 致 的 。 
所 得 结果 为 (n 一 1) X (2 一 1) 和 矩阵 : 
A’ — vw" /an (4-15) 
称 为 4 的 关于 au 的 Schur RFX. 
人 们 断言 , 若 4 是 非 奇异 的 , 则 其 Schur 余子 式 也 是 非 奇异 的 。 为 什么 ? 假定 (2 一 1) 义 
(n 一 1) 的 Schur 余子 式 是 奇异 的 , 按 定理 4-1, 其 行 秩 必 小 于 n=l. M FERE 


an we 
0 A’—vw"/an 


的 底部 的 第 一 列 元 素 全 为 0, 此 和 矩阵 底部 的 "一 1 行 的 行 秩 必 小 于 一 1。 所 以 此 矩阵 本 身 的 
行 秩 必 小 于 ,于 是 A 的 秩 必 小 于 n。 根 据 定理 4-1, 与 推出 A 是 奇异 的 矛盾 。 
由 于 Schur 余子 式 是 非 奇 异 的 ,可 以 递归 地 求 它 的 LU 分 解 。 设 
A’ — vow /an = L'U' 
其 中 十 是 单位 下 三 角 阵 ,U "是 上 三 角 阵 。 于 是 ,利用 矩阵 代数 ,有 


( 1 0 (au w 
A= " 
v/an Laj40  A'— vw'/ay 


-( 1 0 (s we 
v/an ImJ 0 U' 


— LU 
这 就 给 出 了 LU 分 解 (注意 由 于 工 ' 是 单位 下 三 角 阵 ,所 以 工 也 是 ;由 于 U 是 上 三 角 阵 ， 
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所 以 U 也 是 )。 

图 4-1 示例 了 LU 分 解 。 它 展示 了 一 种 标准 的 优化 过 程 ,其 中 的 元 素 “ 原 地 ?存储 在 矩 
V A 中, 即 可 以 在 as 和 4; G>DR us (i<j) 之 间 建 立 起 一 个 对 应 ,并 更 新 A 使 其 在 过 程 终 
结 时 同时 存储 。 

当然 ,车 an 二 0, 这 种 方法 就 不 适用 了 。 这 是 因为 它 将 导致 被 0 除 的 错误 。 而 当 Schur 
RTRA — vow /an 的 左上 角 元 素 为 0 时 ,此 法 也 不 能 正常 工作 ,因为 在 下 一 步 递归 时 ,要 
用 它 来 做 除法 。LU 分 解 中 用 来 做 除法 的 元 素 称 为 基准 元 素 ,它们 位 于 和 矩阵 U 的 对 角 线 上 。 
之 所 以 要 在 LUP 分 解 中 设计 置换 矩阵 已 ,就 是 要 利用 置换 避免 被 0 除 的 问题 。 

图 4-1(a) 为 矩阵 4。 图 4-1(b) 黑 圈 中 的 ay —2 是 基准 元 素 , 阴 影 列 是 v/a ,阴影 行 是 
w, U 的 元 素 计算 于 横 线 之 上 ,L 的 元 素 位 于 竖 线 左边 。Schur AF st HME A! — ow /ay 位 
于 右 下 方 。 图 4-1(c) 为 对 图 4-1(b) 中 的 Schur 余子 式 和 矩阵 进行 操作 。 黑 圈 中 的 as =4 是 
基准 元 素 , 阴 影 列 和 阴影 行 分 别 是 w/az 和 w Schur 余子 式 中 的 部 分 )。 两 条 直线 分 割 出 了 
目前 算出 的 UU WIEC) L 的 元 素 ( 左 ) 和 Schur 余子 式 ( 右 下 )。 图 4-1(d) 为 完成 分 解 
( 当 递 归结 束 时 ,新 的 Schur 余子 式 的 元 素 3 成 为 U 的 组 成 部 分 )。 图 4-1(e) 为 因子 分 解 
A=LU, 


2315 @315 23 15 2315 
613 519 3|42 4 302 4 3|42 4 
2 19 10 23 1/16 9 18 a" BE! 1 402 
4 10 11 31 2| 4 921 287 17 2 1 和 3 

(a) (b) (c) (d) 

2n .和 di FS | 2 3 Ded 

6 13 5 19 i 3100 0424 

2 19 10 23 E 1410 0012 

4 10 11 3l 2271 0003 

A L U 


4-1 LU 分解 


4.2.3 计算 LUP 分 解 


LUP 分 解 背后 的 数学 方法 类 似 于 LU 分 解 。 给 定 nXn 和 矩阵 A ,希望 找到 置换 矩阵 忆 ， 
单位 下 三 角 阵 工 和 上 三 角 阵 U 使 得 PA 二 LU。 在 如 LU 分 解 的 那样 分 割 4 之 前 ,将 第 一 列 
绝对 值 最 大 的 非 零 元 素 ,例如 为 an , 移 到 和 矩阵 的 (1,1) 位 置 上 ( 若 第 一 列 元 素 均 为 0, 按 定 
理 4-4,4 的 行列 式 等 于 0, 故 为 奇异 的 )。 为 保持 方程 组 ,交换 第 1 个 方程 与 第 个 方程 ,这 
等 价 于 4 左 乘 一 个 置换 矩阵 Q 。 于 是 ,可 将 QA 写 为 

o (an w 
oa - (^ xj 
FEB v= (an yagi ag san PER TY anw = Cane sans sam); VAR A FE—F (n— 1) X 
(a DERE, hF aa 天 0, 做 与 在 LU 分 解 中 相同 的 代数 运算 , 且 保 证 不 会 有 被 0 除 的 
问题 : 


179 


从 算法 到 程序 (第 2 NO 


OO D wr E ( 1 0 \(an we 
v A’ v/an La)40 A’ — vw /an 


如 在 LU 分 解 时 看 到 的 , 若 A 是 非 奇异 的 , 则 Schur 余子 式 A' 一 vw /an 也 是 非 奇异 
的 。 所 以 ,能 递归 地 对 它 进行 LUP 分 解 ,得 到 单位 下 三 角 和 矩阵 L ,上 三 角 和 矩阵 和 管 换 和 矩阵 
U' ,使 得 : 


P’(A’ — vw /an) = L'U' 


»-(5 2) 
-h p 


这 是 一 个 置换 矩阵 ,这 是 因为 它 是 两 个 置换 矩阵 之 积 。 现 在 有 


1 » J^ = (3 o 1 "o wr 
o P' (0 PV v/a: Dea) 0 A’ — vw" /an 


1 0 ) bs wr | 
Pv/an 已 八 0 A'— vw" /an 


0 
P'v/an D 0 P'(A'— ones] 


r) 
pos B " 
7 PUR Mp | 


— LU 
得 出 LUP 分 解 。 由 于 LL' 是 单位 下 三 角 和 矩阵 ,所 以 L 也 是 ;由 于 U 是 上 三 角 和 矩阵 ,所 以 U 也 
是 。 注 意 在 此 推导 中 , 列 向 量 v/an 和 Schur 余子 式 A' 一 vw /an 都 必须 与 P'RISE. 

很 容易 将 此 想法 实现 为 下 列 的 递归 过 程 。 动 态 地 用 数组 x 维护 置换 矩阵 忆 , 其 中 n[7]—7 
意味 着 P 的 第 i 行 在 第 j 列 是 1。 初 始 时 xD. n]——1.2. n ,表示 单位 矩阵 。 还 将 代 
码 实 现 为 将 LL 及 U* 原 地 ”计算 在 A 内 。 于 是 , 当 过 程 终止 时 (递归 层次 为 n 时 ): 


ly ij 
ai = H H 

uj i<j 
LUP-DECOMPOSITION(A ,k) 
1 nm-rows[A] 
2 ifk>n 
3 then return 
4 p<0 
5 fori--kton 上 > 搜寻 第 上 列 下 方 绝对 值 最 大 的 元 素 
6 do if |a4 |>p 
7 then p<-| az | 
8 <i 
9 if p=0 DEB kW FARRAH 0 
10 then error "singular matrix" 
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11 exchange x [kJ**xLk’] Dan 是 第 & 列 下 方 元 素 中 绝对 值 最 大 者 
12 for i<-1 to n DRR k SGH 

13 do exchange ay ay; 

14 for i<-k+1 to n DHH Schur RFK 

15 do az ax /au 

16 for j<-k+1 ton 

17 do ajay —anay 


18 LUP-DECOMPOSITION(A ,k+1) 
算法 4-4 对 矩阵 的 LUP 分 解 过 程 


算法 4-4 是 一 个 递归 过 程 , 首 次 调用 前 须 对 表示 置换 矩阵 王 的 全 局 量 数组 1. LEG 
始 化。 第 一 次 调用 时 ,表示 递归 层次 的 参数 人 应 传递 值 1。 第 4 一 8 行 确 定 在 当前 需求 其 
LUP 分 解 的 (2 一 A 十 1) X (n 一 k 十 1) 和 矩阵 首 列 中 具有 最 大 绝对 值 的 元 素 am 。 若 当前 首 列 的 
所 有 元 素 均 为 0, 第 9 行 和 第 10 行 报告 该 矩阵 是 奇异 的 。 在 第 11 行 交换 x[k'] 和 x[k] 表 示 
第 & 行 与 第 A 行 进行 了 置换 ,并 在 第 12 行 和 第 13 行 实际 交换 4 的 第 行 与 第 A 行 ,如 此 构 
成 枢 轴 au ( 整 行 交换 ,因为 在 上 述 的 推导 中 ,不 仅 是 4 vw /an 还 有 v/an 都 要 与 P 相 乘 )。 
最 后 ,在 第 14 一 17 行 计算 Schur 余子 式 , 此 处 写 的 代码 实现 了 “ 原 地 ”操作 。 第 18 行 对 计算 
所 得 的 Schur 余子 式 进行 递归 。 

由 于 每 次 递归 ,第 2 个 参数 增加 1, 注 意 第 1 行 和 第 2 行 根据 参数 k 是 否 达到 n 决定 


递归 是 否 继 所 以 一 共 递 归 nn 次 ,每 次 递归 ,主要 耗 时 发 生 在 第 14~17 行 的 双重 for fff 
环 的 O(2 ) 次 重复 上 。 所 以 ,算法 LUP-DECOMPOSITION 的 运行 时 间 为 OC. 
图 4-2 所 示 为 LUP-DECOMPOSITION 的 运行 。 图 4-2(a) 为 对 矩阵 A 的 第 1 层 操作 。 
1| 2 0 2 06 3 065 4 2 3 6 5 4 2 
C 2 3 3 4 -2 2 B 3 4 一 2| 06) 0 L6 -3.2 
3 © 5 4 2 1 2 0 2 0.6 1 04 -2 04 -2 
4| -1 -2 34 -1 4| ED -2 34 -1 4| -02]-1 42 -0.6 
(a) (b) (e) 
3 5.5 4 2 [5] 5 5 4 2 3 5.5 4 2 
C 2| 06| 0 1.6 -3.2 1| 04 e 0.4 -0.2 1 0.4 e 04 -0.2 
1 0.4 e 04 -0.2 2| 06| 0 1.6 -3.2 2 06 0|L6 -32 
4| -0.2 | -1 42 -0.6 4| -02|-1 42 -0.6 4| -02 0.5 4 -0.5 
(d) (e) (£) 
3 5 5 4 2 3 5 5 4 2 3 3 35-4 2 
1 0.4 | -2 0.4 -02 1 0.4| -2 04 -02 0.4| -2 0.4 -02 
2 06 0|L6 -3.2 4| -02 05| 9 -05 4| -0205| 0 -05 
C 4| -02 05| 0 -05 2 06 0O0|L6 -3.2 2 06 0 04| -3 


0010 2 0 2 06 1 0 00 5 5 4 2 

1000 3 3 4 2 " 0.4 1 00 0 -2 04 -02 

0001 5 5 4 2 E -02 05 1 0 0 0 4 05 

0100 -1 -2 34 -l 06 0 04 1 0 0 0 3 
P A L U 


图 4-2  LUP-DECOMPOSITION 的 运行 
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算法 的 第 一 步 确定 首 列 元 素 5 为 基准 元 素 , 表 示 在 黑 圈 中 。 图 4-2(b) 为 交换 第 1 行 和 第 
3 行 并 更 新 置换 矩阵 。 阴 影 列 与 阴影 行 表示 wv How", FB 4-2(c) 为 向 量 v 替代 为 w/5 , 且 将 
矩阵 的 右 下 角 更 新 为 Schur 余子 式 。 各 条 直线 将 矩阵 分 割 成 3 个 区 域 : U 的 元 素 ( 上 方 )、 
L 的 元 素 ( 左 方 ) ,以 及 Schur 余子 式 的 元 素 ( 右 下 方 )。 图 4-2(d) 至 图 4-2(f) 为 第 2 层 递 归 。 
图 4-2(g) 至 图 4-2(i) 为 第 3 层 递归 。 第 4 层 递归 后 将 不 会 发 生 任何 变化 了 ,所 以 是 最 后 一 
层 。 图 4-2(j) 为 所 得 的 LUP 分 解 。 

算法 4-2 是 末尾 递归 ,很 容易 将 其 转换 为 等 价 的 迭代 版 本 。 


LUP-DECOMPOSITION(A) 

1 n<rows[A] 

2 for i<-1 ton 上 > 初始 化 置换 矩阵 P 

3 do x[i]--i 

4 for k<1 ton 

5 do p--0 

6 for ik ton DIFA PUT 77 AK AY TUE 
7 do if |au|>p 

8 then p4 laa | 

9 ei 

10 if p=0 上 > 若 第 4 列 下 方 元 素 均 为 0 

11 then error "singular matrix" 

12 exchange z[&]e*z[4' ] Da, EBk 列 下 方 元 素 中 绝对 值 最 大 者 
13 for i<-1 ton 上 交换 第 & 行 与 第 人 行 

14 do exchange a, ay; 

15 for i<-k+1 to n DHH Schur RFR 

16 do ax aa /au 

17 for j~-k+1 ton 

18 do aa; —axay 


算法 4-5 ”对 矩阵 的 LUP 分 解 过 程 的 递归 版 本 


算法 4-5 用 一 个 外 层 的 循环 (第 4 一 18 行 的 for 循环 ) 蔡 代 各 层 递归 。 由 于 循环 结构 为 
3 ERE HOZTE AH OG). 


4.2.4 程序 实现 


下 面 仅 实现 LUP 分 解 算法 的 迭代 版 本 。 


1 Matrix lupDecomposition( Matrix a,int * pi) ( 

2 int i,j,k,kl,n=a. row; 

3 double p; 

4 Matrix lu=newMatrixByArry(a. tab,a. row,a. col); 
5 for(i=0;i<n;i ++) 

6 pili]=i; 

d for(k=0;k<n;k++){ 
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8 p=0. 0; 

9 forGi=k;i<n;i++) 

10 if(fabs(lu. tab[i * nt+k])>p){ 

11 p=fabs(lu. tab[i* n+k]); 

12 kl=i; 

13 } 

14 assert(p>le—10); 

15 swap(pi+k, pitkl .sizeof(int) ) ; 

16 swapRows(lu,k,k1); 

17 for(i=k+1;i<n;it++){ 

18 lu. tab[i * nd- k]— lu. tab[i* n+k]/lu. tab[k * n+k]; 
19 forG=k+1si<nsj++) 

20 lu. tab[i * n+j]=lu. tab[i* n+j]— lu. tab[i * n+k] * lu. tab[k * n+j]; 
21 ) 

22 } 

23 return lu; 

24 } 


程序 4-3 ”实现 对 方 阵 进行 LUP 分 解 的 算法 的 函数 


程序 4-3 的 说 明 如 下 。 

(1) 算法 4-4 和 算法 4-5 都 将 返回 两 个 对 象 : 矩阵 A 的 LU 分 解 和 表示 置换 矩阵 己 的 
HH no XT C 函数 来 说 ,不 能 返回 两 个 值 。 为 此 ,将 函数 lupDecomposition 的 返回 值 设 为 
Matrix 型 参数 a 的 LU 分 解 , 当然 也 是 Matrix 型 的 。 而 将 表示 置换 矩阵 了 的 数组 x, 表示 
成 一 个 指向 整 型 数组 的 指针 参数 pi, 

(2) 与 算法 4-5 略 有 不 同 ,lupDecomposition 对 和 矩阵 a 的 LUP 分 解 并 不 在 a 的 “本 地 ” 
进行 ,而 是 将 a 复制 为 Matrix 型 变量 lu( 第 4 行 ), 这 样 做 是 因为 在 很 多 应 用 中 ,对 矩阵 进行 
LUP 分 解 的 同时 还 要 保留 矩阵 本 身 。 对 a 的 LUP 分 解 在 矩阵 lu. 上 进行 ,最 后 函数 返回 lu 
(第 23 行 ) 。 

(3) lupDecomposition 函数 体内 的 代码 结构 与 算法 伪 代 码 的 十 分 接近 ,第 14 行 调用 库 
PRI assert 保证 p#0. H p 字 10- 2 这 种 形式 表示 p 取 0, 是 因为 在 计算 机 中 浮 点 数 不 保 证 精 
度 以 外 的 数字 是 否 准 确 , 所 以 浮 点 型 数据 需要 按 一 定 的 精度 判断 是 否 等 于 0.0 。 第 16 行 调 
用 函数 swapRows, 交换 矩阵 中 指定 的 两 行 。 该 函数 定义 于 文件 夹 algebra 中 的 源 文件 
matrix. c( 原 型 声明 于 matrix. h 中 ) ,读者 可 打开 文件 研读 。 

程序 4-3 中 的 函数 定义 于 文件 夹 algebra 中 的 源 文件 lup. c 中 ,其 原型 声明 保存 在 同一 
文件 夹 的 头 文件 lup. h 中 。 


4.3 解 线性 方程 组 


4.3.1 前 代 法 和 回 代 法 


对 给 定 的 工 .P 和 了 ,前 代 法 能 在 OG? ?时间 内 解 下 式 (4-12)。 注 意 , 我 们 是 用 紧凑 的 数 
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组 形式 x[1.. 站 来 表示 置换 矩阵 卫 。 对 i 二 1,2,…,n,x[ 让 表示 Pia =l 及 GF Aali lM P;— 
0. PA 的 第 i 行 和 第 7 IIRA aca; ,而 Pb 的 第 i 个 元 素 为 bo。 由 于 是 单位 下 三 角 和 矩阵 ， 
式 (4-12) 可 以 重 写 为 

yi = ban 

layı + ys = baz 

layı + loy: + ys = bas 


layı T lays + luys t by, = ban 

可 以 直接 解 得 yi ,因为 第 一 个 方程 告诉 我 们 o = buc. ERE s ,可 以 将 其 代入 到 第 二 

个 方程 ,得 到 : 
y: = bay Z layı 
现在 ,可 以 把 yi 和 ye 代入 到 第 三 个 方程 ,得 到 : 
ys = basy — (nyi 十 Laz y2) 
一 般 地 ,把 wm oye en ,yi-1“ 前 代入 ”第 i 个 方程 解 得 yi: 
Yi = bra — 2 lsy; 

回 代 法 类 似 于 前 代 法 。 给 定 U RI y. 首先 解 第 nn 个 方程 ,然后 向 回 代 入 直至 第 一 个 方 
程 。 如 前 代 法 那样 ,这 个 过 程 运行 8( 妈 ) 时 间 。 由 于 已 是 上 三 角形 矩阵 ,可 以 重 写 
式 (4-13) ,如 


uty 十 uza 十 … 十 ine Ene F aix» + uas, = yi 


Uz2 Te 十 … 十 auia 十 Uz Tel 十 Uae 一 y: 


Un2n2 Tae? 十 Un-ti Tei 十 acra = Yez 
hia Fat = Jia 
Un nEn = Yn 
于 是 ,接连 解 得 xz, ,zx,-1，,… ,zl 如 下 : 
X, = Yn /Unon 
Ee = ua ei) ei 


Tee = yea — Clee Te F users.) / uerit 


或 ,一 般 地 ， 
— 
HE P.L 及 ,过 程 LUP-SOLVER 结合 前 代 法 与 回 代 法 解 x。 


Lup-SOLVE(L,U.x,6) 
ln- rows[L] 


2fori--1ton 
H 

3 do y; 一 px 一 z ly; 
j=1 

4 for i — n downto 1 


184 


第 4 章 代数 计算 


5 do x; — Cy; — M ujz;)/us 
j=Ht1 


6 return 工 


算法 4-6 ”利用 系数 矩阵 的 LUP 分 解 解 线性 方程 组 的 过 程 
过 程 LUP-SOLVE 的 第 2 行 和 第 3 行 用 前 代 法 解 ,然后 在 第 4 行 和 第 5 行 用 回 代 法 解 
ze WFE for 循环 的 每 次 求 和 含有 一 个 隐 性 的 循环 ,所 以 运行 时 间 为 O) 。 
作为 本 方法 的 一 个 例子 ,考虑 如 下 定义 的 方程 组 : 


1 2 0 


n w 
a 
e 


其 中 


A= 


我 们 希望 解 出 未 知 数 x。LUP vag 
1 


L-/|0.2 


120 3 
3 4 4|. b=|7 
5.6 3 8 


0.6 0. 
读者 可 验证 P4 一 LU。 REA Pb 解 


oM 
de 
Js 


所 以 ,得 到 要 求 的 答案 x = 


一 1.4 
2.2 |. 
0.6 


4.3.2 用 LUP 分 解 计算 矩阵 的 逆 


假定 对 矩阵 A 有 一 个 LUP 分 解 , 即 有 3 “AE LU 和 P, 使 得 PA 二 LU。 利 用 LUP- 
SOLVER, ,可 以 在 时 间 OG) ) 内 解 方程 4x 一 5。 由 于 LUP 分 解 依赖 于 A 而 与 b 无 关 , 可 以 用 
另 一 个 8(n?) 时 间 将 LUP-SOLVER 运行 于 形 如 Ax 一 以 的 方程 。 一 般 地 ,一 旦 有 了 4 的 
LUP 分 解 , 就 能 用 G Gen ) 的 时 间 解 个 版 本 的 方程 Ax 二 5, 它 们 中 仅 有 5b 的 不 同 而 已 。 
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方程 
AX — I, (4-16) 
可 以 视 为 n 个 不 同 的 形式 为 Ax =b 的 方程 构成 的 集合 。 这 些 方程 确定 了 A HY REX. 
更 准确 地 说 , 设 X. 表示 的 第 i 列 , 回 忆 单 位 向 量 e; 是 天 的 第 i 个 列 。 式 (4-16) 就 能 因此 
用 对 A 的 LUP 分解 ,分 别 对 每 个 方程 
AX; =e; 
解 出 X; ,进而 解 得 X。 具 体 的 伪 代 码 描述 如 下 。 


MATRIX-INVERSECA) 

1 n-row[A] 

2 allocate X as a nX n matrix 

3 (L,U,P)<-LUP-DECOMPOSITION(A) 
4 for i--1 ton 

5 do X, --LUP-SOLVECL,U P .e;) 

6 return X 


算法 4-7 ”利用 矩阵 的 LUP rfe i E 


每 个 列 X, 能 在 B(x ) 时 间 内 求 得 ,所 以 用 对 4 的 LUP 分 解 在 802) 时 间 内 计算 出 X. 
由 于 可 以 在 86(2) 时 间 内 算得 4 的 LUP 分 解 ,所 以 可 以 在 时 间 内 GO GP ) 确 定 4 T 3x 
HEAT, 


4.3.3 程序 实现 


假定 已 得 到 系数 矩阵 a 的 LUP 分 解 , 可 将 解 线性 方程 组 的 算法 和 计算 a gg eng Sr 
法 实现 如 下 。 


1 double* lupSolve(Matrix lu,int * pi,double * b){ 

2 int i,j,n 一 lu. row; 

3 double * x= (double * )calloc(n,sizeof(double) ) ; 
4 for(i=0;i<n;i+ 十 ){ 

5 x[i]=b[pi[i]]; 

6 for(j=0;j<i;j+ +) 

7 x[i]=x[i]— lu. tab[i * n+j] * x[j]; 

8 } 

9 for(i=n—1;i>=0;i——){ 


10 for(j=i+1;j<n3j++) 

11 x[i]=x[i]— lu. tab[i * n+j] * x[j]; 
12 x[i]— xL i]/lu. tab[i * nci]; 

13 } 

14 return x; 

15] 


16 Matrix matrixInverse( Matrix a) { 
17 double * e— NULL. * xi NULL; 
18 int n—a. row, * pi= (int * )calloc(n,sizeof(int) ) ,i; 


186 


第 4 章 代数 计算 


19 Matrix b— newMatrix(n.n) ,lu,x; 
20 lu=lup(a, pi); 
21 for(i=0;i<n;it++){ 


22 if(e)free(e) ; 

23 e= (double * )calloc(n,sizeof(double) ) ; 

24 e[i]=1. 0; 

25 if(xi)free(xi); 

26 xi=lupSolve(lu, pi,e) ; 

27 memcpy(b. tab+i * n. xi,n * sizeof(double) ) ; 
28 $ 

29 x= transform(b) ; 


30 clrMatrix(lu) ; clrMatrix(b) ; 
31 free( pi) ;free(e) ; free(xi) ; 
32 return c; 

33] 


程序 4-4 解 线性 方程 组 函数 和 计算 逆 矩 阵 函 数 


对 程序 4-4 的 说 明 如 下 。 

(1) 第 1 一 15 行 定义 的 函数 lupSolve 实现 算法 4-6, 解 系数 矩阵 a 的 LUP 分 解 为 lu( 包 
含 下 三 角 阵 王 和 上 三 角 阵 U) ,pi( 表 示 置 换 矩 阵 书 的 数组 ) 的 线性 方程 组 ax 王 b。 其 中 ,第 
4 一 8 行 的 for 循环 实现 算法 4-6 中 第 2 行 和 第 3 行 用 前 代 法 解 y。 与 伪 代 码 在 形式 上 有 所 
不 同 : 


QD 用 第 5 一 7 行 实现 伪 代 码 中 的 求 和 计算 w -bn — May; 


© 没有 为 向 量 y 开辟 专 有 的 存储 空间 ,而 是 借用 向 量 z 的 空间 存储 解 y。 这 是 因为 在 
后 面 的 后 代 法 解 zx 时 ,只 需要 用 到 y[ 让 和 xz[n 一 1,zx[n 一 2j,…,x[i 十 1] 的 值 (i==n 一 1， 
7 一 2,…,0)。 所 以 ,不 会 影响 向 量 zx 的 计算 。 

第 9 一 12 行 的 for 循环 实现 算法 4-6 中 第 4 行 和 第 5 行 用 后 代 法 计算 解 向 量 x. Hop. 


第 10—12 行 实现 伪 代 码 中 的 求 和 计算 2, 一 (y: — > uss) /u 


(2) 第 16—33 行 定 义 的 函数 matrixInverse 实现 算法 4-7, 计 算 Matrix 型 参数 a (wi Ai 
Ve ,并 作为 函数 值 返回 。 其 中 ,第 20 行 调 用 函数 lupDecomposition 计算 a 的 LUP 分 解 , 结 
果 保 存在 矩阵 lu 和 数组 pi 中 。 第 21 一 28 的 for 循环 实现 算法 4-7 中 第 4 行 和 第 5 行 得 for 
MA GE EE x 中 的 每 一 列 xi。 与 算法 的 伪 代 码 相 比 ,形式 上 有 如 下 区 别 。 

(D 第 22—24 行 设置 第 i 个 分 量 为 1, 其 他 分 量 为 0 的 单位 向 量 ei。 

© 第 25 行 和 第 26 行 调用 lupSolve 计算 解 方程 ax 二 ei, 计 算 逆 矩阵 的 第 i 列 xi. 

© 由 于 定义 的 矩阵 中 数 表 是 以 行 优先 原则 存储 的 ,所 以 第 26 行将 xi 暂时 存 于 矩阵 b 
的 第 i 行 。 

第 29 行 调用 函数 transform, 计 算 矩 阵 b 的 转 置 得 出 a BE x, TE 32 行 返回 x 之 
前 ,第 30 行 释放 Matrix 型 变量 lu, b 的 存储 空间 ,第 31 行 释放 向 量 e、pi、xi 的 存储 空间 以 
防 内 存 泄漏 。 

程序 4-4 定义 的 函数 保存 于 文件 夹 algebra 中 的 源 文件 lup. c( 原 型 声明 于 头 文件 lup. 
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h) 中 ,以 备 调用 。 


4.4 多 项 式 及 其 计算 


4.4.1 多 项 式 及 其 表示 


变量 z 取 自 于 一 个 代数 域 的 多 项 式 是 一 个 表示 成 和 式 的 函数 : 
AG) = S iuh; 


把 assar ana RAAE TRR 系数 取 自 于 域 ,通常 是 复数 域 C。 多 项 式 
A(z) 称 为 是 人 次 的 , 若 其 最 高 非 零 系数 是 we 。 任 何 大 于 多 项 式 次 数 的 整数 称 为 该 多 项 式 的 
次 界 。 因 此 ,以 为 次 界 的 多 项 式 次 数 可 能 是 0 一 "一 1 之 间 的 任何 一 个 整数 。 


1, 系数 表示 法 


以 坟 为 次 界 的 多 项 式 A(z) = Saye! 的 系数 表示 法 是 一 个 由 系数 构成 的 向 量 = 


«ap sais san- 0 
系数 表示 法 对 多 项 式 的 一 些 运算 来 说 是 方便 的 ,例如 ,对 多 项 式 A(z) 在 给 定点 ze 处 的 
求 值 计算 。 利 用 Horner 规则 , 求 值 : 
A(x) = ae 十 zo(ai + xo (a; 十 。。 十 zo(a-z + 19 (Gy-1)))) 
下 列 算法 实现 Horner 规则 。 


HORNER(ao s**t 4, 9X0) 
1-0 

2 for i <- n—1 downto 0 

3 do yo a; tzo * yo 


4 return yo 
算法 4-8 计算 多 项 式 值 的 Horner 算法 


算法 4-8 耗 时 8(n)。 这 是 一 个 渐 增 型 算法 ,第 2 一 4 行 for 循环 的 一 个 循环 不 变量 叙述 
如 下 。 
在 第 2 一 4 行 的 for 循环 的 每 次 重复 之 初 ， 


nD 


yo = >) ameh 
为 证 明 这 个 循环 不 变量 ,考察 第 一 次 重复 之 初 , wm = wii 一 7 一 1。>) amri = 
ren 


a.a 一 yo。 这 说 明 此 时 循环 不 变量 为 真 。 设 1i n 时 循环 不 变量 为 真 , 即 本 次 重复 之 初 


yo = >) aid. 在 本 次 重复 中 ,第 3 行 执行 yo<a; 十 z。" yos XAMA 


m 
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则 执行 i<-i 一 1, 则 上 式 变 成 Es anixi, 且 此 状态 将 维持 到 下 一 次 重复 之 初 。 这 就 证 明了 


次 循环 不 变量 是 正确 的 。 循 环 终止 时 ,; 一 一 1, yo = Dast, 这 恰 是 想 要 得 到 的 。 


2. 点 值 表 示 法 
以 为 次 界 的 多 项 式 A(z) 的 点 值 表示 法 是 个 点 值 对 构成 的 集合 


(xo5yo2 mI} 


使 得 所 有 的 ze 都 不 相同 且 


y=A(z) k=0,1,.…%…,n—1 (4-17) 
一 个 多 项 式 有 很 多 点 值 表 达 形 式 , 这 是 因为 任意 7 个 不 同 的 点 xo sans st ,zx,-1 都 能 用 来 构成 
一 个 点 值 表示 。 


3. 系数 表示 与 点 值 表示 的 转换 法 


对 一 个 系数 法 表示 的 多 项 式 计算 它 的 一 个 点 值 表 示 形 式 是 很 直接 的 ,这 是 因为 只 要 选 
JBUn AS AR ed] aco ani tt tn PET A Cay) 40.1.7 n—1. H Horner Wik 3X n POR 
值 计算 耗 时 OGP). fie AURI. AE TG Wh Hh YE BO vL 3Xx — 1 $E WT VA Jn xi Jy às FS fe] JE 
Qnlgn) 。 

求 值 计算 的 逆 一 一 由 多 项 式 的 一 个 点 值 表达 形式 确定 其 系数 表达 形式 一 一 称 为 插值 。 
定理 4-5 说 明 只 要 假定 欲 插值 的 多 项 式 的 次 界 等 于 给 定 的 点 值 对 数 ,插值 定义 是 良好 的 。 

定理 4-5( 多 项 式 插值 的 唯一 性 ) 对 于 任意 的 AEREE {Cros yo) s Cisy) stts 
(zs-1bya-1)), 若 所 有 的 x 各 不 相同 , 则 存在 唯一 的 以 为 次 界 的 多 项 式 ACz) ,满足 y, = 
AC) ,&—0,1,*,n—1, 

WEBB EWE EE T XR AER SEI FEE HEN. 3X CA- 170 p TR IAE ZEE 


" 2 n-l 
1 Xo x 77 x ao yo 
l mn ato af ay » 

: F .|=| ~ (4-18) 
l za £a rad zo ari Yra 


左边 的 矩阵 记 为 VCzo zi, m JE RJ. Vander-monde 和 矩阵。 根据 线性 代数 ,此 矩阵 的 
行列 式 是 
Ka 4$) 
0s jk n-l 
Fx, 各 不 相同 ,根据 定理 4-4, 它 是 可 道 的 。 于 是 ,各 系数 a; 可 以 被 点 值 表达 形式 唯一 解 得 
a =V (£09213 Ta) y 

定理 4-5 的 证 明 描 述 了 基于 解 线性 方程 组 (4-18) 的 插值 算法 。 利 用 4.2 节 的 LUP 分 
解 算法 ,可 以 在 OG ) 时 间 内 解 出 它 来 。 

最 后 ,来 考虑 如 何 对 一 个 表示 为 点 值 形式 的 多 项 式 求 在 一 个 新 的 点 处 的 值 。 这 可 先 将 
点 值 形式 转换 成 系数 形式 ,然后 对 系数 形式 求 在 新 点 处 的 值 。 
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4.4.2 多 项 式 的 运算 


1. 系数 形式 


人 们 和 希望 对 多 项 式 定 义 一 些 运算 。 对 多 项 式 加 法 ,车 A(r) 和 B(z) 是 以 nn 为 次 界 的 多 
项 式 , 说 它们 的 和 C(z) 也 是 以 为 次 界 一 个 多 项 式 , 使 得 对 域 中 所 有 的 + 均 有 C(x)= 
A(z) 十 B(x)。 也 就 是 说 ,车 


m ml 
A(z) = jazi 及 Blix) = Jibi 
j=0 j=0 
则 


其 中 c==aj 十 bj,j 二 0,1,…,n 一 1。 例 如 ,车 有 多 项 式 AGO —62z 722—109 及 B(x)= 
2zs: 十 4z 一 5, 则 C(z) 一 4z3 十 7z2 一 6z 十 4。 由 系数 向 量 a= Cao sai sau Ml b= (bos 
1,"…,b,-1) 表 示 的 两 个 次 界 为 n 的 多 项 式 A AB 的 加 法 表示 成 伪 代 码 过 程 如 下 。 
SuM(A,B) 
1 for j4-0 to n—1 
2 do c;<-a; +b; 
3 return C DC BER BUM. eso cua B AER 


算法 4-9 系数 形式 多 项 式 的 加 法 过 程 


不 难看 出 ,SUM 过 程 耗 时 960. 

对 多 项 式 乘法 , 若 A(z) 和 5B(z) 是 以 ?为 次 界 的 多 项 式 , 它 们 的 积 CCz) 是 以 2n 一 1 为 
次 界 一 个 多 项 式 , 使 得 对 域 中 所 有 的 + 均 有 C(z) 二 A(z) B(x)。 你 可 能 曾经 通过 把 A GO 
的 每 个 项 与 B(x) 的 每 个 项 相 乘 ,然后 合并 同类 项 来 将 两 个 多 项 式 相 乘 。 例 如 ,可 将 
A(z) 王 6z3 十 7z2: 一 10z 十 9 M B(x) =—22°+42—5 HE: 


62° +72°—10x+9 
X) —22* 十 4z 一 5 
— 304? —35a* 4-50 — 45 
24x* -- 282? — 402* +362 
+) —1225— 1425 +202‘ —18a* 
122° — 143? +442 — 202? — 75a? 4- 86x — 45 


另 一 种 表示 积 CCz) 的 方式 是 


22-2 


CG) = Moz (4-19) 
=o 
其 中 
EST (4-20) 
注意 degree(C) =degree(A) +degree(B). ü 
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将 式 (4-19) 和 式 (4-20) 写 成 伪 代 码 过程 如 下 。 


PRODUCT(A B) 
1 for j< 0 to 2n—2 


2 do c; 4-0 

3 for k<-0 to j 

4 do c; 7c; 3-a4b;-. 
5 return C 


算法 4-10 系数 形式 多 项 式 乘法 过 程 


用 过 程 PRODUCT 计算 多 项 式 乘积 将 耗 时 O) ,这 是 因为 向 量 a 中 的 每 一 个 系数 必须 
与 向 量 尺 中 的 每 一 个 系数 相 乘 。 系 数 表示 的 多 项 式 的 乘法 看 来 比 求 值 运算 或 多 项 式 加 法 运 
算 要 难得 多 。 由 式 (4-20) 给 出 的 结果 系数 向 量 c 也 称 为 输入 向 量 a Alb WER RH e= 
a@9b。 由 此 可 见 , 如 何 更 快 地 计算 向 量 卷 积 是 有 效 计算 多 项 式 乘积 的 基本 因素 。 


2. 点 值 表示 


对 多 项 式 的 很 多 运算 点 值 表 达 形 式 都 是 很 方便 的 。 对 加 法 而 言 , 若 CC) = AC) + 
BCz), 则 对 任 一 点 xy Clr) =A) + Bly). HA A 的 一 个 点 值 表 达 形 式 : 
Geo sy Gn yi etna y) 
和 B 的 点 值 表达 形式 : 
(Ga s Ca 91) 920° 9 (ea sys] 
TERE A 和 B 在 相同 的 n 个 点 处 求 值 , 则 C 的 一 个 点 值 表达 形式 为 
(Gro «yo + yo) Cri «i + yt) stts Cres ye + ys! 
于 是 ,将 两 个 以 为 次 界 的 多 项 式 的 点 值 表达 形式 相 加 耗 时 B(x)。 类 似 地 ,点 值 表示 形式 
对 多 项 式 的 乘法 也 是 很 方便 的 。 若 CO) = AC) BGz), 则 对 任 一 点 xr Clr) =A Cr) Bla) o 
且 能 按 对 应 点 相 乘 来 把 A 的 点 值 表达 式 与 B 的 点 值 表达 式 相 乘 得 到 C 的 点 值 表 达 式 。 
必须 面 对 C 的 次 界 是 A 的 次 界 与 B 的 次 界 之 和 。A 和 B 的 标准 点 值 表达 形式 分 别 由 
个 点 值 对 构成 。 将 它们 相 乘 得 到 C 的 点 值 表达 形式 ,但 由 于 C 的 次 界 是 2n, 需 要 2n 个 点 
值 对 作为 C 的 点 值 表达 式 。 所 以 必须 从 “扩展 "A 和 B 的 点 值 表达 式 为 含有 2n 个 点 值 对 开 
始 。 给 定 A 的 扩展 点 值 表达 式 : 
(Gy 9 (x1 yis Gea yn)! 
以 及 也 的 扩展 点 值 表达 式 : 
Go 9.90) 5 Gri yos Gra 9 Y) 
WW C 的 点 值 表达 式 为 
{Cros yoyo) ,x1 VIVID) ems Geo ssi V2} 
给 定 两 个 扩展 点 值 表示 形式 的 多 项 式 作为 输入 ,将 它们 相 乘 得 到 结果 的 点 值 表 达 式 的 时 间 
是 Bn, 这 要 比 将 两 个 系数 形式 相 乘 所 需 的 时 间 少 得 多 。 


4.4.3 FFT 


能 使 用 线性 时 间 的 点 值 形式 多 项 式 乘法 来 加 速 系 数 形式 的 多 项 式 乘法 吗 ? 答案 取决 于 
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从 系数 形式 转换 成 点 值 形式 ( 求 值 ) 和 反 过 来 (插值 ) 的 能 力 。 

可 以 选取 任何 点 作为 求 值 点 ,通过 仔细 选择 求 值 点 ,可 以 仅 用 8(nlgn) 时 间 在 两 种 表示 
形式 之 间 转 换 。 如 将 在 本 节 中 看 到 的 , 若 选择 * 复 单位 根 作 为 求 值 点 ,可 以 通过 计算 系数 向 
量 的 “离散 Fourier 变换 ”(Discrete Fourier Transform 或 DFT) ,产生 一 个 点 值 形 式 。 其 逆 
变换 插值 ,可 以 通过 对 点 值 形式 取 *DEFT 的 逆 ? 而 得 到 系数 向 量 。 本 节 将 说 明 FFT 是 如 何 
在 @(nlgn) 时 间 内 执行 DFT 及 DFT 的 逆 的 。 

图 4-3 形象 地 说 明了 此 策略 。 要 注意 次 界 。 两 个 以 nn 为 次 界 的 多 项 式 的 积 的 次 界 是 
2n。 在 对 输入 的 多 项 式 A 和 B 求 值 之 前 ,要 先 通过 增加 个 系数 为 0 的 高 次 数 项 来 将 它们 
的 次 界 增加 到 22。 由 于 向 量 有 2n 个 元 素 , 用 “2n 次 单位 根 ”, 在 图 4-3 PRH wx 。 
ddp d 
ROS 时 间 @0D) 


点 值 计算 插值 计算 
时 间 B(nlgn) 时 间 B(nlgn) 


) 系数 形式 


AQ$,), BOW) 
(wb), Bow) 点 值 形式 乘法 


HEOC 点 值 形式 


AQ, BOZ) 


图 4-3 一 种 有 效 的 多 项 式 乘 法 的 图 形 轮廓 


图 4-3 所 示 为 一 种 有 效 的 多 项 式 乘法 的 图 形 轮廓 。 项 部 的 表示 形式 是 系数 形式 ,底部 
的 是 点 值 表达 形式 。 自 左 向 右 的 箭头 对 应 于 乘法 运算 。wz 表 示 2n 次 单位 根 。 

给 定 FFT, 有 以 下 的 @(nlgn) 时 间 对 次 界 为 n 的 多 项 式 A(zx) 和 B(x) 的 乘法 过 程 ,其 中 
输入 与 输出 都 是 系数 形式 。 假 定 n 是 2 的 整 寡 ; 这 一 要 求 总 可 以 通过 添加 系数 为 0 的 高 次 
项 而 得 到 满足 。 

(1) 两 倍 次 界 : 通过 对 A Ce) A B(z) 的 系数 表达 式 中 创建 系数 为 0 的 高 次 项 来 完成 。 

(2) 求 值 : 通过 两 次 应 用 2n Br FFT, 求 得 AGOJ& B(z) 点 值 表 达 式 。 这 两 个 表达 式 包 
含 了 两 个 多 项 式 在 2n 次 单位 根 处 的 值 。 

(3) 按 点 相 乘 : 通过 将 这 些 值 的 按 点 相 乘 ,计算 多 项 式 C(z) 二 A(z)B(z) 的 点 值 表达 
式 。 此 表达 式 包 含 了 CDHE 2n 次 单位 根 处 的 值 。 

(4) 插值 : 通过 对 2n 个 点 值 对 调用 FFT 计算 DFT 的 道 计算 多 项 式 CCz) 的 系数 表 
达 式 。 
步骤 (1) 和 (3) 耗 时 6 G0 ,步骤 (2) 和 (4) 耗 时 8(Czlgz)。 因 此 ,一 旦 说 明了 如 何 使 用 
FFT ,将 证 明定 理 4-6。 

定理 4-6 ”输入 与 输出 均 为 系数 形式 ,两 个 以 为 次 界 的 多 项 式 的 积 可 以 在 9(Czlgz) 时 
间 内 算得 。 

1. DFT 和 FFT 


刚才 声称 车 使 用 复 单位 根 , 就 能 在 BCzlgz) 时 间 内 进行 求 值 和 插值 。 下 面 , 就 来 定义 
复 单位 根 并 研究 它们 的 性 质 , 定 义 DFT, 说 明 FFT 如 何在 9(Czlgz) 时 间 内 计算 DFT 及 
其 道 。 
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1) 复 单 位 根 

一 个 次 复 单位 根 是 一 个 复数 ,使 得 wr" 三 1。 

TUB n T n 次 复 单位 根 ,它们 是 eh" ,k= 二 0,1,…,n 一 1。 为 解释 这 一 结论 ,利用 复数 的 
指数 形式 定义 : 


e" = cos(u) + isin(u) 
图 4-4 ERT n AP LH DER A) e CE TT HP 3E 
以 原点 为 圆心 ,半径 为 1 的 圆 上 。 值 
we = e ir (4-21) 
MON n 次 复 单 位 主根 ,其 他 的 次 复 单位 根 都 是 久 ， 
TRE S BI I n 次 复 单位 根 是 


0 1 1 
Op On Wn 


nn 次 复 单位 根 的 基本 性 质 由 如 下 引 理 给 出 : 图 4-4 复 平面 中 的 值 wm os von 
—2ni/n SP o, =e E 8 次 复 单位 主根 ) 


oO, =e 
引 理 4-1( 消 去 引 理 ) 对 任 一 整数 20.20, 
及 d>0: 
oh = of 
WEBB 本 引 理 直接 由 式 (4-21) 而 得 ,这 是 因为 


qu, = (em) = (em/n)t = wt 


推论 4-2. 对 任 一 偶数 二 0， 


证 明 这 是 因为 
quU 一 Wren? 等 值 变 换 
=a! 消去 律 
一 a 


一 一 1 式 (4-21) 


(4-22) 


5|38 4-2( 折 半 引 理 ) 若 770 是 偶数 , 则 个 n 次 复 单 位 根 的 平方 是 /2 个 n/2 KE 


单位 根 。 


WEBB 根据 消去 引 理 ,对 任 一 非 负 整数 ,有 (w*)? 二 wwa*。 若 对 所 有 n e n 次 复 单 位 


根 进行 平方 , 则 每 个 n/2 次 单位 根 将 得 到 两 次 ,这 是 因为 


于 是 ,wi oL? 具有 相同 的 平方 值 。 


正如 将 会 看 到 的 那样 , 折 半 引 理 是 多 项 式 的 系数 形式 及 点 值 形 式 之 间 进 行 转换 的 分 治 


方案 的 基础 。 因 为 , 它 保证 了 递归 子 问题 只 有 一 半 大 。 
5138 4-3 ”对 任意 整数 三 1 及 不 能 被 n 整除 的 非 负 整数 k: 


n-l 
Mb 一 0 
j= 
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WEBB K ot 视 为 公 比 g, 则 有 


= 等 比 级 数 前 项 和 


-D1 次 复 单位 主根 


w,—1 
=0 
要 求 & 不 能 被 ”整除 是 为 了 保证 分 母 不 为 0。 
2) DFT 
回顾 我 们 所 希望 的 是 对 次 界 为 n 的 多 项 式 


ml 
AG) = Maj 


RAE @,° ,oo st eo! CHE n AP n 次 复 单 位 根 ) 了 ?处 的 值 。 不 失 一 般 性 ,假定 是 2 IE. 
这 是 因为 对 给 定 的 次 界 总 能 重新 放大 一 一 总 能 添加 所 需 的 系数 为 零 的 高 次 项 。 假定 A 由 
系数 形式 给 出 ; a 二 (ao sai st sas-1)。 对 二 0,1,…,n 一 1, 定 义 结果 : 

yk = Alk) = Paot (4-23) 


HIRE y= Cop vic ) 是 系数 形式 ae 一 Co «ai sas IEB Fourier 变换 (DFT) 。 
我 们 写成 y=DFT, (a). 

3) FFT 

利用 称 为 快速 Fourier 转换 (FFT) 的 方法 ,可 以 在 (nlgn) 时 间 内 计算 DFT, (a)。 该 方 
法 利用 了 复 单位 根 的 特性 ,运行 效率 高 于 OC ) 时 间 的 直接 方法 。 

FFT 方法 采用 分 治 策略 ,将 A(z) 的 偶 下 标 和 奇 下 标 系 数 分 别 定义 两 个 次 界 为 n/2 的 
多 项 式 AU Cr) RI AU (x): 


AW) (zx) = ao tara tax? 十 … + a S207 


AM (x) 一 ai c az d aga? 十 … + aua xt 
Am 包含 A 的 所 有 下 标 为 偶数 的 系数 (下 标的 二 进 制 表示 以 0 结尾 ), 而 A 中 包含 A 的 所 有 
下 标 为 奇数 的 系数 (下 标的 二 进 制 表示 以 1 结尾 )。 这 意味 着 
A(z) 一 Am(z2) 十 zAD(z2) (4-24) 
所 以 在 wm es es ttt or 处 的 求 值 约 简 为 如 下 。 
CD 求 次 界 为 n/2 WEAR A) 和 AD](z) 在 点 
Co? Col? Got? (4-25) 


O KH n fe 4.4.1 节 中 为 2, 这 是 因为 在 求 值 之 前 需要 将 给 定 多 项 式 的 次 界 加 倍 。 在 多 项 式 乘法 讨论 中 ,总 是 对 
2n 次 复 单位 根 进行 操作 。 
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处 的 值 。 

(2) 按 式 (4-24) 合 并 结果 。 

根据 折 半 引 理 , 式 (4-25) 恰 含 n/2 个 不 同 的 n/2 次 复 单位 根 ,每 个 根 在 其 中 恰 发 生 两 
次 。 所 以 ,次 界 为 n/2 的 多 项 式 递归 地 求 n/2 个 n/2 次 复 单位 根 处 的 值 。 这 些 子 问题 的 形 
式 与 原 问题 的 相同 ,但 规模 仅 为 其 半 。 这 样 就 成 功 地 将 个 元 素 的 DFT, 计算 划分 成 两 个 
n/2 个 元 素 的 DFT,j; 计 算 。 这 一 分 解 是 下 列 的 递归 FFT 算法 的 基础 ,该 算法 计算 具有 个 
TER H [e] it a = Cao yar,…,a,-1) 的 DFT, 其 中 ,n 是 2 IE. 


RECURSIVE-FFT(a) 
n --length[a] Dn Æ 2 WE 
ifn=1 

then return a 
w, tehn 
Pr 
a!) «— (ao saz s**t ranz) 
aU (a, 9Q3 9°" ss) ) 
y? -- RECURSIVE-FFT a? ) 
y «- RECURSIVE-FFT Ca? ) 
10 for k <-0 to n/2—1 
11 do yey tay, 


€ 0 - O Oc & we 


12 Deron He} — ey, UD 
13 aes 


14 return y 上 假定 y 是 列 向 量 
算法 4-11 计算 多 项 式 的 FFT 的 递归 算法 


RECURSIVE-FFT 过 程 运 行 如 下 。 第 2 行 和 第 3 行 表 示 递 归 头 :一 个 元 素 的 DFT 是 其 本 
身 , 这 是 因为 在 此 情形 中 : 
Yo = aoan’ = ao * 1 = ao 
第 6 行 和 第 7 行 定义 A 四 和 AUT RR. B AT 5 13 13 TRE o 得 以 及 时 更 
新 ,使 得 在 第 11 行 和 第 12 行 执行 时 ,w= 二 w,* (跟踪 w 的 每 一 次 重复 的 运行 值 ,而 不 是 在 每 次 
重复 中 用 一 个 for 循环 来 计算 o, ,以 此 节省 时 间 )。 第 8 (RIS 9 行 执行 的 DFT 递归 计 
算 , 其 中 ,对 &=0,1,…,z/2 一 1, 置 
y, Em AU Cnt)» 
y» = AU Cana") s 
或 ,根据 消去 引 理 ,由 于 ous — e, 
y P AUI (o, 7 ) 
y 三 AUI (w,?* ) 
第 11 行 和 第 12 行将 两 个 递归 DFT 计算 的 结果 加 以 合并 。 对 yo ,mm st syna 11 行 得 出 
y= y?) ey? 
= AUI (uf) + at AM (a) 
= AG) (根据 式 (4-24)) 
其 中 的 最 后 一 个 等 式 是 直接 遵循 式 (4-24) 。 对 ywa yusei etta BE k=0,1, n/2—1. 
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第 12 行 得 出 


Yerum 一 y" = wyf 
= E + wht?) I (因为 obrem —— aw) 


a= AMD (oit) + wt AUI (2) 
= AU) (ode) + wet AD] ( een ) (因为 ot EM P 
= Alo?) (根据 式 (4-24)) 
于 是 ,由 RECURSIVE-FFT 返回 的 向 量 y 确实 是 输入 a 的 DFT. 
在 第 10 一 13 行 的 for 循环 中 ,每 一 个 y, (LESE SS ou^ 相 乘 ,Rk 二 0,1,…,n/2 一 1。 该 
积 既 要 与 vi? 相 加 也 要 与 其 相 减 。 因 为 每 个 以 因子 既 要 用 到 正 的 也 要 用 到 负 的 ,因子 co," 
称 为 旋转 因子 。 
为 了 确定 过 程 RECURSIVE-FFT 的 运行 时 间 , 除 了 递归 调用 以 外 ,每 次 耗 时 8(n), 其 中 
nn 是 输入 向 量 的 长 度 。 所 以 运行 时 间 的 递归 方程 为 
TG) = 2T(n/2) + 860 = O(nlgn) 
于 是 ,能 在 时 间 @(nlgn) 内 利用 快速 Fourier 变换 求 得 次 界 为 的 多 项 式 在 n 次 复 单 位 
根 处 的 值 。 


2. 复 单位 根 处 的 插值 
现在 通过 说 明 如 何 将 复 单位 根 择 入 成 一 个 多 项 式 , 从 而 将 点 值 形式 转换 成 系数 形式 来 


由 式 (4-18), 可 以 把 DFT 写成 矩阵 积 y —V,a ,其 中 V, 是 由 o, 的 各 次 等 构 成 的 矩阵 : 
Yo 1 1 il 1 m 1 "m 
» l ow [DH wi er! äi 
ye l o wn ws aro? | |a 
s| ow a a | | as 
Na 1 wr! gD 3D oe wD) PAR 


V, B Ce jE of ;j,k 二 0,1,… n —1. HL V, 的 项 的 指数 构成 一 个 乘法 表 。 
xp wie 55. GM a — DET; (y) ,可 以 通过 将 y 乘 以 V, 的 逆 和 矩阵 V, 得 到 。 
定理 4-7 对 j,k==0,1,…,n 一 1,V, BEG OME wi*/n。 

WEBB VV, — LB Xn 单位 阵 。 考 虑 VV 的 第 (j ,j ) 项 : 


nl 
[V V.]y = D (or /n) CF ) 
k-0 
nl 
= Mt [n 
k=0 
根据 和 式 引 理 ( 引 理 4-12) ,此 和 式 当 也 一 7 时 等 于 1, 否则 的 话 为 0。 注 意 ,要 求 一 一 1) 二 


j'—jn-— L3 FE j' — j 就 不 会 被 整除 ,因此 可 以 应 用 和 式 引 理 。 
IgM V, ,我 们 有 由 式 (4-26) 给 出 的 DET; O): 


n= 4 yes" (4-26) 
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j 二 0,1,…,n 一 1。 比 较 式 (4-23) 和 式 (4-26) 可 看 到 ,只 要 把 FFT 算法 中 交换 a 和 y 的 角 
色 , 把 o, M o, | ,并 把 结果 中 的 每 个 元 素 除 以 n, 就 算得 DFT WOE. FE. DFT, 也 能 
在 9Czlgz) 时 间 内 算得 。 

这 样 ,利用 FFT 及 FFT 的 道 ,能 在 次 界 为 n 的 多 项 式 的 系数 形式 与 点 值 形式 之 间 用 时 
间 来 回转 换 。 对 多 项 式 的 乘法 问题 .已 经 证 明了 定理 4-8。 

定理 4-8 ”对 任意 的 两 个 长 度 为 的 向 量 a 和 2 ,其 中 是 2 E: 

a ® b = DFTa (DFT,, (a) * DFT», (b)) 

其 中 向 量 a Mo 的 长 度 用 0 填充 成 为 2n, H“ e ”表示 两 个 长 度 为 2 的 向 量 按 分 量 的 积 。 


3. FFT 的 迭代 实现 


RECURSIVE-FFT 的 第 10—13 行 的 for 循环 涉及 两 次 对 值 ob ye) 的 计算 ,这 样 的 值 称 为 
公共 子 式 。 可 以 改变 该 循环 ,将 此 值 保存 在 临时 变量 1 中 ,使 之 对 其 只 计算 一 次 。 
for k--0 to n/2—1 
do twy, 7 
yc n 


vein tyt 


在 此 循环 中 ,用 w5 乘 以 旋转 因子 w= 二 以 ,将 积 保存 于 4 中 ,并 加 入 y BUA yx 中 中 间 去 4， 
此 称 为 蝶 形 运算 。 

图 4-5 所 示 为 蝶 形 运算 。 图 4-5(a) 为 两 个 输入 从 左边 进入 ,旋转 因子 以 乘 以 yc ,和 
与 差 在 右边 输出 。 图 4-5(b) 为 蝶 形 运算 的 简化 图 。 


» yen p Wey! 
m m 
[0] 1 0) 1 
E Jte gno oi! 
(a) (b) 
4-5 MBER 


现在 来 说 明 如 何 将 FFT 算法 在 结构 上 从 递归 改 为 迭代 。 在 图 4-6 中 ,已 经 将 初始 
n=8 调用 RECURSIVE-FFT 时 的 输入 向 量 表示 成 树 状 结构 。 树 中 的 每 个 结 点 对 应 一 次 递归 
调用 的 输入 向 量 。 除 非 输入 向 量 仅 有 一 个 元 素 ,RECURSIVE-FFT 的 每 次 调用 都 将 引发 两 个 
递归 调用 。 把 第 一 个 递归 调用 表 为 左 孩子 ,第 二 次 调用 表 为 右 孩子 。 


4-6 RECURSIVE-FFT 过 程 递归 调用 的 输入 向 量 树 (首次 调用 "一 8) 
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观察 这 棵 树 ,发 现 若 将 初始 向 量 a 中 的 元 素 按 它们 在 树叶 中 出 现 的 顺序 排列 ,就 可 以 按 
下 列 的 方式 执行 RECURSIVE-FFT 过 程 。 首 先 , 按 对 取 元 素 , 每 一 对 用 一 个 蝶 形 算 子 计算 它 
们 的 DFT 并 取而代之 。 于 是 , 原 向 量 就 包含 了 n/2 个 双 元 素 的 DFT。 接 着 ,对 这 n/2 个 按 
对 取 之 ,用 由 两 个 碟 形 算 子 计算 的 四 元 素 DFT 替代 原来 的 两 个 双 元 素 DFT。 于 是 原 向 量 
就 包含 了 n/A 个 四 元 素 DFT。 继 续 以 此 形式 操作 ,直至 向 量 含 有 两 个 n/2 元 素 的 DFT, 这 
样 就 可 以 用 n/2 个 碟 形 算 子 算得 最 终 的 n ICR DFT. 

为 将 此 观察 转换 成 代码 ,使 用 一 个 数组 AL[0..n 一 1j, 它 最 初 将 输入 向 量 a 的 元 素 按 它 
们 在 图 4-6 的 树 中 叶子 的 顺序 排列 存储 ( 稍 后 将 说 明 如 何 用 一 种 称 为 比特 翻转 的 方法 来 确 
定 这 一 顺序 )。 由 于 在 该 树 的 每 一 层 做 合并 ,所 以 引进 一 个 变量 s 来 对 层次 计数 ,从 1 开始 
(在 底层 ,将 两 个 元 素 合并 为 双 元 素 DFT) 到 lgn( 在 顶层 ,合并 两 个 n/2 元 素 的 DFT 得 到 最 
终结 果 ) ,于 是 算法 有 如 下 的 结构 : 

1 for s< 1 to lgn 

2  dofor£--0 to n—1 by 2 

3 do combine the two 2*^! -element DFT's in 

ALR ..&-- 2771 —1] and A[k+ 2.. k +2 1] 
into one 2'-element DFT in A[k ..&-- 2: 1] 

可 以 将 循环 体 ( 第 3 行 的 ) 表 达成 更 准确 的 伪 代 码 。 从 过 程 RECURSIVE-FFT 中 复制 for (ff 
环 ,用 ACR .. &-F 271 — 1] fH y? ,用 ALA 十 2 一 :.. 十 2 一 1] 替 代 > 。 每 个 蝶 形 算 子 按 不 
同 的 * 值 使 用 旋转 因子 。 旋 转 因 子 是 w, 的 竹 , 而 m 二 2:( 引 入 变量 m 是 为 加 强 可 读 性 ) 引 入 
另 一 个 临时 变量 ,使 得 能 就 地 进行 蝶 形 运算 。 在 把 第 3 行 蔡 换 为 该 循环 体 后 ,得 到 如 下 的 
伪 代 码 , 它 是 稍 后 将 介绍 的 并 行 实现 的 基础 。 此 代码 首先 调用 辅助 过 程 BIT-REVERSE- 
COPY (aA) ,将 向 量 a 按 初始 所 需 的 值 的 顺序 复制 到 数组 A 中 。 


ITERATIVE-FFT(a) 
1 BIT-REVERSE-COPY (a.A) 


2 ne length[a] Dn is a power of 2 
3 fors < 1 to lgn 

4 do m -— 2° 

5 "n 

6 for k <- 0 to n—1 by m 

7 do w= 1 

8 for j+ 0 to m/2—1 

9 do t < oA[ kj -m/2] 
10 u < A[k+j] 

11 Alkt+j]< utt 

12 A[k+j+m/2]< u—t 
13 中 二 wom 


算法 4-12 计算 多 项 式 FFT 的 迭代 算法 


BIT-REVERSE-COPY 是 如 何 将 输入 向 量 a 中 的 元 素 按 所 需 顺序 复制 到 数组 A 中 去 的 
We? 图 4-6 的 树 中 叶子 顺序 称 为 比特 翻转 置换 , 即 若 设 rev(&) 为 将 的 二 进 制 表达 式 翻 转 后 
所 得 的 lgn 位 二 进 制 表达 式 , 则 希望 把 向 量 元 素 as 置 于 数组 A[rev(A) 的 位 置 上 。 例 如 ， 
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图 4-6 中 叶子 排列 顺序 是 0,4,2,6,1,5,3,7; 该 序列 的 二 进 制 表达 式 为 000,100,010,110， 
001,101,011,111, 当 将 它们 的 比特 翻转 后 得 到 序列 000,001,010,011,100,101,110,111。 
为 理解 一 般 情况 下 为 什么 要 做 比特 翻转 置换 ,注意 在 树 的 顶部 元 素 下 标的 最 低位 为 零 的 都 
置 于 左 子 树 中 ,而 下 标的 最 低位 为 1 的 元 素 都 置 于 右 子 树 中 。 在 每 一 层 中 剥离 最 低位 ,继续 
往 下 操作 ,直至 叶子 层 上 得 到 比特 翻转 置换 顺序 。 

完成 整数 & 的 二 进 制 比特 翻转 的 函数 rev(A) 很 容易 建立 ,过 程 如 下 。 


BIT-REVERSE-COPY(a,A) 
ln< length[a] 
2 for k = 0 ton—1 
3 do c<rev(k) 
4 Alc] < a 
算法 4-13 计算 多 项 式 系数 比特 反 转 置换 的 算法 


FFT 的 迭代 实现 的 运行 时 间 是 8(nlgn)。BIT-REVERSE-COPY(a,A) 过 程 的 调用 显然 
耗 时 OCilgn) ,这 是 因为 做 次 迭代 , 且 用 O(gn) 时 间 把 介 于 0 一 "一 1 之 间 的 lgn 位 二 进 制 
整数 做 比特 翻转 。 为 完成 ITERATIVE-FFT 运行 于 8(nlgn) 时 间 内 的 证 明 , 来 说 明 最 里 层 的 
循环 体 (第 8 一 13 TH) DUT UB LGD FE 8(nlgn)。 第 6~13 行 的 for 循环 对 每 个 * 值 重复 n/ 
mm 三 n/2’ 次 ,而 最 里 层 第 8 一 13 行 的 循环 重复 /2 一 2 一 次 。 于 是 : 


= O(nlgn) 


4.4.4 程序 实现 


1. 复数 类 型 及 其 运算 


由 于 对 多 项 式 的 FFT 涉及 复数 计算 ,所 以 必须 先 定 义 复数 数据 类 型 并 实现 关于 复数 的 
算术 运算 。 
typedef struct{ 
double real; 
double magic; 
}Complex; 


1 
2 
3 
4 
5 Complex compSum(Complex a,Complex b){ 
6 Complex c; 

7 c. real— a. real 十 b. real; 

8 c. magic— a. magic 十 b. magic; 

9 return c; 

10 } 


11 Complex compDiff(Complex a,Complex b) { 
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12 Complex c; 


13 c. real— a. real— b. real; 

14 c. magic— a. magic— b. magic; 
15 return c; 

16 } 


17 Complex compProd(Complex a,Complex b) { 
18 Complex c; 


19 c. real— a. real * b. real— a. magic * b. magic; 
20 c. magic a. real * b. magic--a. magic * b. real; 
21 return c; 

22 } 


23 Complex compQuot(Complex a, Complex b) ( 
24 Complex c; 
25 double r— b. real * b. reald- b. magic * b. magic; 


26 assert(r) ; 

27 c. real— (a. real * b. real-- a. magic * b. magic) /r; 
28 c. magic= (a. magic * b. real— a. real * b. magic) /r; 
29 return c; 

30 } 


程序 4-5 复数 类 型 的 定义 及 其 算术 运算 函数 

对 程序 4-5 的 说 明 如 下 。 

CD 第 1 一 4 行将 复数 定义 成 具有 2 个 double 型 属性 real, magic 的 结构 体 类 型 
Complex。 其 中 属性 real, magic 分 别 表示 复数 的 实 部 和 虚 部 。 

(2) 第 5 一 10 行 及 第 11 一 16 行 定义 的 函数 compSum 及 compDiff 分 别 实现 复数 的 加 
法 与 减法 运算 Car +r i) + Caz 4-02) — (a a3) (bi E bii 

(3) 第 17 —22 行 定义 的 函数 compProd 实现 复数 的 乘法 运算 (a Hoi) * Caz bi) = 
Ca, * a5—bi * by) + Cay * b +b; * az dio 

(A) 第 23—30 行 定 义 的 函数 compQuot 实现 复数 的 除法 运算 (a Hori) + Caz Hbi) = 
(Gay * az by * b)+ Ch * a; ay * bz))/ Cas? +627). 

程序 4-5 中 ,Complex 类 型 的 定义 及 各 函数 的 原型 声明 保存 于 文件 夹 algebra 中 的 头 文 
{F complex. h 中 ,各 函数 定义 保存 于 同一 文件 夹 的 源 文件 complex. c (P, 


2. 计算 FFT 
仅 实现 计算 4-12 中 计算 FFT 算法 的 迭代 版 本 。 


1 static Complex * bitReverseCopy(Complex * a,int n){ 

2 int bit, i, k.lgn.c.d; 

3 Complex * A= (Complex * )calloc(n,sizeof(Complex)) ; 

4 Ign=Ig(n) ; / * E n 的 二 进 制 位 数 * / 

5 for(k=0;k<n;k++){ 

6 bit=1;c=0; 

? for(i=0;i<lgn;i ++) /* 对 kk 逐 位 转换 到 对 称 位 得 到 cx / 
8 ifCk&-bio ( /*k 的 第 i 位 为 1*/ 
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9 d=1;c|==(d<<==(lgn 一 i 一 1)); 。 /* 将 d 添 加 到 c 的 对 应 位 上 */ 
10 bit<<=1; /* bit EB 1 fi / 

11 

12 A[c]—a[k]; 

13 } 

14 return A; 

15 } 

16 Complex * fft(Complex * a,int n,int inv) { / * 3ExE IHR FFT * / 

17 int ssm=1,lgn,j,k; 

18 Complex * A=bitReverseCopy(a,n); /* A 赋值 为 a 的 比特 反 转 置换 * / 
19 lgn=lg(n); /* 计 算 n 的 二 进 制 位 数 */ 
20 for(s=1;s<=lgn;s++){ 

21 Complex wm; 

22 m* =2; 

23 wm. real=cos(2 * PI/m) ;wm. magic— inv * sin(2 * PI/m); 

24 for(k=0;k<n;k+ =m) { 

25 Complex w= {1.0,0.0},t,u; 

26 forG=0;j<m/23j++){ 

27 t=compProd(w,A[k+j+m/2]); — / * tw ALk+j+m/2] * / 
28 u=A[k+j]; / * u- A[kj] * / 

29 A(k+j]=compSum(u,t) ; / * ACk+j]<utt* / 

30 A[k4-j4-m/2]— compDiffCu. t); / * ACk+jt+m/2]+u—t * / 
31 w=compProd(w, wm); / * 计算 旋转 因子 * / 

32 

33 ) 

34 ) 

35 return A; 

36 } 


程序 46 ”实现 计算 向 量 a 的 FFT 算法 的 函数 


对 程序 4-6 的 说 明 如 下 。 

CD 第 1 一 15 行 定 义 的 函数 bitReverseCopy 实现 算法 4-13, 计 算 具 有 n 个 元 素 的 数组 
a 的 比特 反 转 ,将 计算 结果 作为 函数 值 返回 。 其 中 ,第 4 行 调用 函数 lg(n) 计 算 m 的 二 进 制 
位 数 。 该 函数 定义 在 文件 夹 algebra 的 源 文件 fft. c 中 ,读者 可 打开 文件 研读 。 第 5 一 13 fT 
的 for 循环 实现 算法 4-13 中 的 第 2 一 4 ATHY for 循环。 循环 体 中 第 6 一 11 行 的 操作 实现 的 
是 算法 4-13 中 的 操作 creo (D 。 基 本 思想 是 将 k 的 从 低 到 高 的 非 0 各 位 (bit 从 1 开始 与 
k 按 位 与 k& bit, 每 次 重复 的 最 后 将 bit 左 移 1 位 bt<<= 1) BH c 的 从 高 到 低 的 各 对 应 位 
(d—1;cl 2 (d — — (Ign—-i—1))), 

(2) 第 14—36 行 定 义 的 函数 fft 实现 算法 4-12, 快 速 计算 n 维 向 量 a 的 DFT。 注意， 
int 型 参数 inv 为 1 时 ,正常 计算 a 的 DFTs inv 为 一 1 时 ,该 函数 计算 DFT. 

(3) 在 ffc 的 函数 体 中 ,第 18 行 调用 函数 bitReverseCopy, 计 算 a 的 比特 反 转 ,结果 保 
EF Complex 型 的 数组 A 中 ,完成 算法 4-12 中 的 第 1 行 操作 BIT-REVERSE-COPY(a,A)。 
第 20 一 34 行 的 for 循环 实现 算法 4-12 中 第 3—11 行 的 for 循环 。 其 中 第 23 行 完成 算法 中 
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对 旋转 因子 的 初始 化 操作 wn 7e ^. (计算 DFT 时 指数 应 为 负 ) 式 中 的 m 值 在 每 次 重复 
时 通过 和 迭代 mx 一 2, 置 为 2。 这 是 根据 数学 中 复数 的 表达 式 etr" = cos2x/m + isin2n/m 
而 得 。 内 崔 于 该 循环 中 的 第 24 一 33 行 的 for 循环 对 应 于 算法 4-12 中 的 第 6 一 11 行 的 for 
循环 。 其 中 ,第 25 行 中 将 复 单位 根 w 初始 化 为 {1.0,0.0} ,对 应 于 算法 中 的 o1 操作 。 其 
余部 分 的 操作 与 算法 中 的 几乎 一 一 对 应 。 要 注意 的 是 ,由 于 进行 的 算术 运算 是 对 复数 进行 
的 ,所 以 加 、 减 、 乘 应 分 别 调用 函数 compSum compDiff , compProd 来 完成 。 

程序 4-6 中 的 函数 定义 于 文件 夹 algebra 中 的 源 文件 ffc c 中 ,fft 的 原型 声明 保存 在 同 
一 文件 夹 内 的 头 文件 ft. h 中 。 


3. 计算 FFT" 


尽管 在 函数 {ft 中 用 参数 inv 来 控制 计算 DFT 还 是 DFT- , 当 inv 为 一 1 时 ,调用 fft 还 
不 能 完成 DFT 的 计算 ,因为 还 需要 对 得 到 的 向 量 除 以 n。 这 由 下 列 的 函数 来 完成 。 


1 Complex * fftInverse(Complex * a,int n){ / * 3EXIH DFT 3i « / 
Complex * b,x— (1. 0/n,0.0) ; 
inti; 
b=fftCasn,—1); 
for(i—0;i-n;id- d) 
b[i]— compProd(b[i] 3) s 
return b; 


0 - O GO & Qo t 


程序 4-7 “完成 DFT-' 计 算 的 函数 

该 函数 的 第 2 行将 x 置 为 1/n。 在 第 4 行 计算 出 b=fft(a,n, 一 1) 后 ,第 5 行 和 第 6 行 
的 for 循环 完成 对 向 量 b 除 以 n 的 操作 。 

函数 fftInverse 也 定义 于 源 文件 Mt c 中 ,其 原型 声明 也 在 头 文件 fft. h 中 。 

4. 多 项 式 及 其 算术 运算 


利用 定义 好 的 复数 类 型 及 对 复数 的 算术 运算 函数 及 对 向 量 的 FET 变换 函数 ,将 多 项 式 
定义 为 如 下 的 结构 体 类 型 。 


1 typedef struct{ /* 多 项 式 类 型 */ 
2 Complex * coeff; | * BBR « / 

3 int degree; 1 * KR / 

4 }Polynomial; 

5 double horner( Polynomial a,double x) { /* 和 起 纳 法 计算 多 项 式 的 值 * / 
6 Complex y= (0. 0,0. 0) ,x0— (x,0. 0) ; 

7 int i, n— a. degree; 

8 for(i=n;i>=0;i——) 

9 y=compSum(a. coeff[ i], compProd( x0, y)) ; 

10 return y. real; 

11} 

12 Polynomial polySum( Polynomial a, Polynomial b) { /* BURR A * / 
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13 int m 一 a. degree,n 一 b. degree.i—0.j—0.k—0; 


14 Polynomial c=newPoly((m>n? m:n)+1); /* 和 多 项 式 * / 
15 while(i— — m8-8.j— —n) 

16 c. coeffLk + + ]=compSum(a. coeffLi 十 十 ] ,b. coeff( j-- +D); 

17 while(i< =m) 

18 c. coeff[k+ + ]=a. coefflit +]; 

19 while(j< =n) 

20 c. coeff[k++ ]— b. coeff[j++]; 

21 k 一 一 ; 

22 while(k>08-8-isZero(c. coeff[k 一 一 ])) [x 去掉 高 次 项 0 系数 */ 
23 c. degree— — ; 

24 return c; 

25 } 

26 static Complex * componentwiseMult (Complex * f.Complex* g.int n){ / * 按 分 量 积 */ 
27 Complex* p= (Complex * )calloc(n,sizeof(Complex)); 

28 int i; 

29 for(i=0;i<n;i++) 

30 pLi]=compProd¢fLi],gli])s 

31 return p; 

32 } 

33 Polynomial polyProd( Polynomial f, Polynomial g) { / * 多 项 式 相 乘 * / 
34 int L, n, max, min; 

35 Polynomial p; 

36 Complex * a+ * by * x«* ys *zi 


37 max=f. degree>=g. degree? f. degree:g. degree; 

38 min-— f. degree< =g. degree? f. degree: g. degree; 

39 L=max+min+1; 

40 n=1; 

41 while(n<1)n * =2; 

42 assert(a= (Complex * )calloc(n,sizeof(Complex) )) ; 
43 memepy(a,f. coeff, (f. degree+ 1) * sizeof(Complex)) ; 
44 assert(b— (Complex * )calloc(n,sizeof(Complex) )) ; 
45 memepy(beg. coeff, Cg. degree+ 1) * sizeof(Complex) ); 
46 x—fft(a.n. D sy=fft(b.n. 1); 

47 z=componentwiseMult (x.y.n); 

48 p. coeff=fftInverse(z,n) ; 

49 p. degree=min+ max; 

50 ÍreeCa) ;free(b) ;free(x) ; freeCy) ; free(z) ; 

51 return p: 

52) 


程序 4-8 “多项式 类 型 定义 及 多 项 式 的 运算 函数 
对 程序 4-8 的 说 明 如 下 。 


CD 第 1 一 4 行将 多 项 式 定义 成 具有 2 个 属性 的 结构 体 类 型 Polynomial。 其中， 
Complex 型 指针 coeff 指引 表示 系数 的 数组 ,int 型 degree 表示 多 项 式 的 次 数 。 之 所 以 要 将 
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系数 向 量 定义 成 Complex 型 的 数组 ,是 因为 要 使 用 FFT 计算 多 项 式 的 乘法 。 实 系数 多 项 
式 的 每 个 系数 可 以 用 虚 部 为 0 的 复数 表示 。 

(2) 第 5 一 11 行 定义 的 函数 horner 实现 算法 4-8, 用 霍 纳 法 计算 多 项 式 在 指定 子 变 量 
值 x 处 的 值 。 由 于 多 项 式 的 系数 表示 成 了 复数 ,所 以 第 6 行将 计算 结果 y 初始 化 为 {0. 0， 
0.0}, 且 用 {x,0.0} 初 始 化 x0 ,便于 跟 多 项 式 的 系数 进行 算术 运算 。 程 序 代 码 与 算法 伪 代 码 
的 结构 是 一 致 的 ,只 是 要 调用 复数 的 运算 函数 来 计算 相应 的 算术 运算 。 

(3) 第 12 一 25 行 定义 的 函数 polySum 实现 算法 4-9, 计 算 两 个 多 项 式 a,b 的 和 ,并 将 其 
作为 函数 值 返回 。 其 中 ,第 15 行 和 第 16 行 的 while 循环 计算 a、b 对 应 项 系数 的 和 ,作为 和 
多 项 式 对 应 项 的 系数 。 第 17 行 和 第 18 行 处 理 a 的 次 数 高 于 b 的 次 数 时 ,次 数 高 于 n 的 剩 
余 项 系数 。 类 似 地 ,第 19 行 和 第 20 行 处 理 b 的 次 数 高 于 a 的 次 数 的 情形 。 由 于 两 个 同 次 
多 项 式 相 加 可 能 造成 高 次 宕 系数 为 0, 第 22 行 和 第 23 行 处 理 去 掉 系 数 为 0 的 高 次 项 。 

(A) 第 33 一 52 行 定义 的 函数 polyProd, 利 用 对 向 量 的 FET 变换 计算 多 项 式 f 和 g 的 
积 , 并 将 其 作为 函数 值 返 回 。 其 中 ,第 39 行 计算 积 多 项 式 的 系数 数组 长 度 工 ,第 41 行 最 接 
近 于 工 的 2 的 整数 寡 , 记 于 mn。 第 42 一 45 行将 fg 的 系数 向 量 分 别 扩展 成 长 度 为 n 的 数组 
a\b。 第 46 行 调用 函数 {ft 分 别 计算 向 量 a A b 的 DFT 记 为 x、y。 第 47 行 调用 函数 
componentwiseMult, 计 算 x.y 的 点 值 积 , 记 为 z, 该 函数 定义 于 第 26 一 32 行 。 第 48 行 调用 
函数 {ftInverse 计算 z 的 DET! ,作为 多 项 式 p 的 系数 向 量 。 第 49 行 设置 p 的 次 数 。 至 
此 ,完成 了 定理 4-8 中 计算 多 项 式 积 

a &) b = DFT;, (DFT (a) * DFT;, (G2) 
的 全 部 工作 。 第 50 行 释放 各 中 间 临 时 向 量 ab x yz 的 空间 ,51 行 返回 计算 结果 多 项 式 p。 

程序 4-8 中 定义 的 Polynomial 类 型 及 关于 Polynomial 型 数据 的 各 算术 运算 函数 的 原 
型 声明 存储 于 algebra 文件 夹 中 的 头 文件 polynomial. h 中 ,各 函数 的 定义 存储 于 同一 文件 
夹 中 的 源 文件 polynomial. c 内 。 

顺便 说 明 一 下 ,程序 4-8 中 的 Polynomial 类 型 为 适应 FFT 变换 中 复数 的 运算 ,所 以 将 
系数 向 量 定义 成 Complex 型 的 数组 。 如 果 将 多 项 式 的 乘法 实现 为 算法 4-10 那样 的 向 量 的 
卷 积 , 则 可 将 系数 向 量 定义 成 double 型 数组 。 笔 者 比照 程序 4-8, 实 现 了 实 系数 多 项 式 类 型 
Poly 以 及 对 Poly 型 数据 的 算术 运算 函数 。 代 码 存储 于 algebra 文件 夹 中 的 头 文件 poly. h 
和 poly. c 中 ,读者 可 打开 文件 参考 。 


4.5 应 用 


4.5.1 多 项 式 的 泰勒 展开 式 


Equivalent Polynomial 
Description 


Given a polynomial Daat +a, Ż 0 and a number ¢. please convert it into an equivalent 
k=0 


polynomial in the form of Mo G — D* b, A 0. 


k=0 
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Input 

The input contains several test cases. 

The first line of each test case gives two integer n (1<n< 200) and ¢ (—10<?<10), 
The following line is a sequence of n integer ao ,al «*** «a, (— 1000 a; 1000) . which is 
separated by exactly one space. 

Output 

For each test case, output the equivalent polynomial's coefficient bo» b; » *.5,. One 
line for each test case and each number is separated by exactly one space.no extra space at 
the end of each line. 

Sample Input 

21 

102 


Sample Output 


342 


l. 问题 的 理解 与 分 析 
对 给 定 的 多 项 式 函 数 f(x) = 5 aiias 关 0 及 常数 41, 假定 有 另 一 个 nn 次 多 项 式 


g(x) = (Zz 一 0)*,b, 闫 0 与 之 相等 , 即 ET. 一 Talao. 要 求 计 算出 g(x), 即 
k=0 [m i-o 
计算 出 g(z) 的 系数 向 量 (bo sba ，…,b,)。 
将 多 项 式 /(x) 看 成 x 的 函数 ,数学 分 析 告 诉 我 们 7Cz) 对 并 的 各 阶 导数 有 着 非常 “ 优 
良 ” 的 结构 
f? (x) = flx) = a taxta +e dr aux" 
Sf’ Ge) 一 十 2aszr 十 3asz2 + + na," 
f? Go) = Cf G)' = 21a; 4-3 * 2aix +e 4 nO — a,x" 


f? G) = Cf (z))' = bla; +o nO — DO k+ Da,z** 


f? Cz) = CF ())' = nla" 
f° (xr) 一 0 


可 以 用 下 列 过 程 对 由 f= Gas «ai ，… a) 给 定 的 所 项 式 , 计 算 它 的 导数 。 


DERIVATIVE(f) 

1 for i+ l ton 

2 dobiti. a; 

3 return f — (b sb ,b, 1) 


算法 4-14 计算 多 项 式 f(z) 导 数 的 过 程 
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回 到 问题 本 身 。 由 f(x) = Dart = my (zx 一 D)* = g(x), 有 


fO = bo b, = f(t) 
FO = by = f'G 
f? W = 215 b, = f? Q)/2! 
: 之 1: 

SPO = kb, b, = f? Q)/k! 


f? Q) = nb, b, = f? ()/n! 


即 (GO = g(x) = Y. G—0* = WO qz p, ihe forte cc REI AERE 


式 。 


也 就 是 说 ,对 给 定 的 多 项 式 /(x) = Yast 和 数值 4, 计 算出 SODE x= 处 的 泰勒 展 


开 式 ,就 解决 本 问题 的 要 求 。 利 用 DERIVATIVE 过 程 , 可 以 写 出 如 下 的 计算 f(z) 在 x=1 处 
的 泰勒 展开 式 的 算法 。 
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TYLER(f,t) 

1 factor — 1, fi f Dk 的 阶乘 factor 初始 化 为 1,k 阶 导数 f. 初始 化 为 F 
2 fork < 0 ton 

3 do if k>0 


4 then factor *— factor +k 
5 b, *- HORNER( f; +t) /factor Db, =f” (t)/k! 
6 fit DERIVATIVE( fi) 户 计算 k 十 1 阶 导 函 数 


7 return g= (bo sbi ,b,) 


算法 4-15 多 项 式 fGOdE =t 处 的 泰勒 展开 式 的 过 程 
2. 程序 实现 


1 Poly derivative(Poly D ( 

2 int n=f. degree. k; 

3 Poly f1—newPoly(n) ; 

4 for(k=1;k<=n;k+ +) 

5 fl. coeff[k—1]=f. coeff[k] * k; 
6 return fl; 

7) 

8 Poly tylerCPoly f.double t){ 

9 int k.n— f. degree; 

10 Poly f1— newPolyByArry(f. coeff,n 十 1) t£— (NULL; — 1) ;g— newPoly(n4- D ; 
11 double factor— 1.0; 

12 for(k=0;k<=n;k++){ 


13 if(_k!=0) 

14 factor * =k; 

15 g. coeff[ k]— horner(f1, t) /factor; 
16 polyAssign( &tf, f1) ;clrPoly(f1) ; 
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17 {1= derivative(tD ; 

18 } 

19 clrPoly(fl) ;clrPoly(tf) ; 

20 return g; 

21} 

22 int main(void) { 

23 double t; 

24 Poly g={NULL,—1} f={NULL,—1}; 


25 int k,n; 
26 FILE * f1— fopen("chap04/Equivalent Polynomial/inputdata. txt","r"), 
27 * {2=fopen("chap04/Equivalent Polynomial/outputdata. txt" ,"w") ; 


28 assert f18.8.[2) ; 
29 while( !feofCf1)) ( 


30 fscanf(f1,"%d%lf",&-n, &t); 

31 ifCf. coeff) clrPoly(f) ; 

32 f=newPoly(n+1); 

33 for(k=0;k<=n;k++) 

34 fscanfCf1, " /41f" f. coefft+k) ; 
35 if(g. coeff) clrPoly(g) ; 

36 g=tyler(f.t); 

37 for(k=0;k<=n;k++) 

38 fprintf({2,"%. 0f ",b. coeff [ k D ; 
39 Íputc(^n' £2) ; 

40 ) 


41 clrPolyCD ;clrPoly(g) + 
42 felose(f1) ; fclose({2) ; 
43 return 0; 

44 } 


程序 4-9 解决 Equivalent Polynomial 问题 的 C 程序 


对 程序 4-9 的 说 明 如 下 。 

CD 第 1 一 7 行 定义 的 函数 derivative 实现 算法 4-14, 计 算 多 项 式 函 数 f(z) 的 导 函 数 
(x)。 程 序 代码 结构 与 算法 伪 代 码 结 构 很 接近 。 需 要 注意 的 是 ,该 函数 的 形 参 f 是 Poly 
型 数据 , 且 函 数 返 回 值 也 是 Poly 型 的 。Poly 类 型 定义 在 文件 夹 algebra 中 的 poly. h P. 

(2) 第 8 一 21 行 定义 的 函数 tyler ,实现 算法 4-15, 计 算 多 项 式 函 数 /(zx) 在 z=t 处 的 泰 
勒 展 开 式 。 程 序 代码 与 算法 伪 代 码 结构 十 分 接近 。 需 要 注意 的 是 ,Poly 型 数据 的 coeff 属 
性 是 由 指针 指引 的 动态 内 存 。 所 以 ,在 第 17 行 对 Poly 型 变量 fl 重新 赋值 之 前 ,需要 在 第 
16 行 中 调用 clrPoly 函数 ,释放 已 占有 空间 ,以 防 内 存 泄漏 。 

(3) 第 22—44 行 定义 的 main 函数 利用 Poly 类 型 并 调用 tyler 函数 ,解决 Equivalent 
Polynomial 问题 。 第 29 一 40 行 的 while 循环 对 存储 于 由 文件 指针 fl 指引 的 输入 文件 中 的 
每 个 案例 数据 重复 计算 多 项 式 在 指定 点 处 的 泰勒 展开 式 。 其 中 ,第 30 £A fl 中 读 取 多 项 
x EDO n 和 自 变量 的 指定 值 t。 第 31—35 E F1 中 读 取 多 项 式 f 的 系数 向 量 。 其 中 第 
31 行 和 第 32 行 对 释放 已 占有 的 空间 ,理由 与 (2) 中 对 £1 重新 赋 之 前 释放 空间 的 一 样 ,请 
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参阅 。 第 35 行 和 第 36 行 调 用 函数 tyler 计算 {在 t 处 的 泰勒 展开 式 g。 注 意 第 35 行 对 g 
所 做 的 释放 空间 的 操作 。 第 37 一 39 行 输出 g。 
程序 4-9 存储 于 文件 夹 chap04\Equivalent Polynomial 中 的 源 文件 EquivalentPolynomial. c. 


4.5.2 完善 序列 


Complete the sequence! 


You probably know those quizzes in Sunday magazines: given the sequence 1.2.3.4. 
5,what is the next number? Sometimes it is very easy to answer, sometimes it could be 
pretty hard. Because these " sequence problems" are very popular. ACM wants to 
implement them into the "Free Time" section of their new WAP portal. 

ACM programmers have noticed that some of the quizzes can be solved by describing 
the sequence by polynomials. For example. the sequence 1. 2.3.4.5 can be easily 
understood as a trivial polynomial. The next number is 6. But even more complex 
sequences, like 1.2.4.7.11.can be described by a polynomial. In this case.1/2 * n? — 1/2 * 
n+1 can be used. Note that even if the members of the sequence are integers. polynomial 
coefficients may be any real numbers. 

Polynomial is an expression in the following form: 

PG) = ap * n? +apa * n?’ +e +a enta 
If ap ~0,.the number D is called a degree of the polynomial. Note that constant function 
P(n)=C can be considered as polynomial of degree 0. and the zero function P (n) —0 is 
usually defined to have degree— 1. 

Input 

There is a single positive integer T on the first line of input. It stands for the number 
of test cases to follow. Each test case consists of two lines. First line of each test case 
contains two integer numbers S and C separated by a single space. 1<S<100,1<C<100, 
(S+C)<100, The first number.S. stands for the length of the given sequence, the second 
number.C is the amount of numbers you are to find to complete the sequence. 

The second line of each test case contains S integer numbers X, . X; .**:. X5 separated 
by a space. These numbers form the given sequence. The sequence can always be 
described by a polynomial P (n) such that for every i. X; = P (i). Among these 
polynomials, we can find the polynomial P,; with the lowest possible degree. This 
polynomial should be used for completing the sequence. 

Output 

For every test case. your program must print a single line containing C integer 
numbers.separated by a space. These numbers are the values completing the sequence 
according to the polynomial of the lowest possible degree. In other words. you are to print 
values Po(S 十 1) Prin (S+2) ,— , PA, (SHO). 
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It is guaranteed that the results P,;, CS-- i) will be non-negative and will fit into the 
standard integer type. 


Sample Input 


4 

63 

123456 

82 
124711162229 
102 
1111111112 
110 

3 


Sample Output 


789 
37 46 
1156 
3333333333 


1, 问题 的 理解 与 分 析 


对 于 一 合法 案例 数据 C,S,y ,ys，… ,yc ,要 求 计算 出 一 个 多 项 式 p(x) ,使 得 该 多 项 式 
满足 2 一 yi 一 1,2,…，,S, 并 用 此 多 项 式 计算 输出 p(S 十 1),p(S 十 2),…,p(S 十 C)。 
设 p(x) — po piat per! W pCi) =b; .i—1.2. SEE — AA pos pisces 
ps-1 为 未 知 数 的 方程 组 : 
Dock t lob po bem psal =b 
Pot pie 2+ i2 b en peu25 = hb 


pot pie SH pS? d pea S! = bs 
该 方程 组 的 系数 矩阵 是 一 个 Vandermonde 矩阵 : 


1 S e œ 
对 已 知 正 整数 S, 可 以 用 以 下 过 程 创建 这 一 矩阵 。 
VANDERMONDE( S) 
lfori--1toS 
2 do V[i.1]-— 1 
t1 
for j- 2to S 


no ew 


dot<t*j 
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6 Viijl<t 
7 return V 


算法 4-16 生成 S 阶 Vandermonde 矩阵 的 过 程 
Vandermonde 5f [/ J£ — 4 n] 3 [Vg ,该 方程 组 有 唯一 解 p= (ac «ai 7 sas)" ,利用 LUP- 
DECOMPOSITION Xf V 进行 LUP 分解, 并 调用 LUP-SOLVE 解 方程 组 Vp =b, Kp y— Gs. 
by stt bs? ,就 能 确定 多 项 式 p(x) =a aire das a7. BET p(x) Ja. wt 
HORNER, ,就 可 计算 并 输出 PCS jf) ,7 一 1,2,…,S, 问 题 从 而 得 以 解决 。 


2. 程序 实现 


1 Matrix vandermonde(int s) ( 

2 Matrix v— newMatrix(s. s) s 

à int i,j; 

4 double t; 

5 forGi=1;i<=s;i++){ 

6 v. tab[ (i— 1) * s]=t=1. 0; 
ğ forj=2;j<=s;j++) 

8 v. tab[G—1) * s+j—1]=t=t* i; 
9 ) 

10 return v; 

11} 


12 int main) { 

13 double * b=NULL; 

14 int n,t,s,c, * pi NULL, i,k; 

15 Poly p={NULL,—1}; 

16 Matrix a= {NULL,0,0} ,lu={NULL,0,0}; 

17 FILE * f1=fopen("chap04/Complete the sequence/inputdata. txt" ,"r") , 


18 * {2=fopen("chap04/Complete the sequence/outputdata. txt" ,"w") ; 

19 assert Cf18.8-[2) ; 

20 fscanfCf1, " 6d" , 8-0; /* 读 取 案 例 数 * / 

21 for(k=0;k<t3k++){ / * 对 每 一 个 案例 * / 

22 fscanf(fl,"%d%d", &s,&-c)5 /* 读 取 案例 中 的 数据 sc / 
23 if(b)free(b); 

24 if(pi)free(pi); 

25 assert(b= (double * )calloc(s,sizeof( double) )) ; 

26 assert( pi— (int * )calloc(s,sizeof( int) )) ; 

27 for(i=0;i<s;i+ 十 ) /* 读 取向 量 bx/ 

28 fscanf(f1," %1f" ,b+i) s 

29 ifCa. tab) clrMatrix(a) ; 

30 a=vandermonde(s) ; / * #93 Vandermonde 矩阵 * / 
31 ifClu. tab) clrMatrix(lu) ; 

32 lu=lupDecomposition(a; pi) ; / * Xt afit LUPA / 

33 if(p. coeff) free(p. coeff) ; 

34 p. degree=s—1; 
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35 p. coeff 一 lupSolve(lu,pi,b); / * #877 BA ap 一 bx / 

36 nomalPoly( &p) ; 

37 for(i—0;i-c;it +) / * 计算 并 输出 p(s 十 1),… ,p(s 十 c) * / 
38 fprintf({2,"%. Of " ,horner( p.id- s- 1.00); 

39 fpute(\n', f2); 

40 } 


41 free(b) ;free(pi) ; 

42 clrMatrix(a) ; clrMatrix(lu) ; 
43 clrPoly(p); 

44 fclose(fl) ;fclose(f2); 

45 return 0; 

45 } 


程序 4-10 ”解决 Complete the sequence 问题 的 C 程序 


对 程序 4-10 的 说 明 如 下 。 

CD 第 1 一 11 行 定义 的 函数 vandermonde, 实 现 算法 4-16 计算 s lr vandermonde 矩阵 ， 
并 作为 函数 值 返回 。 注 意 ,利用 程序 4-1 中 定义 的 类 型 Matrix 表示 矩阵 。 

(2) 第 12 一 45 行 定 义 的 main 函数 将 调用 vandermonde 函数 ,程序 4-3 中 定义 的 
lupDecomposition 函数 ,程序 4-4 中 定义 的 lupSolve 函数 解决 Complete the sequence 问题 。 
问题 的 输入 数据 包含 于 文件 指针 fl 指向 的 磁盘 文件 inputdata. txt 中 ,输出 数据 记录 在 文 
件 指针 £2 指向 的 磁盘 文件 outputdata. txt 中 。 

(3) 在 main 函数 中 ,第 20 行 读 取 输 入 文件 £1 中 的 案例 数 t。 第 21 一 40 行 的 for 循环 
重复 处 理 t 个 案例 。 其 中 ,第 22 FF HE £0 中 读 取 案例 数据 s 和 ec。 第 27 行 和 第 28 ITE D 中 
读 取 向 量 b。 第 30 行 调用 函数 vandermonde 构造 s 阶 vandermonde 矩阵 a。 第 32 行 调 用 
lupDecomposition 函数 对 a 进行 LUP 分 解 , 结 果 存 于 和 矩阵 lu 及 向 量 pi 中 。 第 35 行 调用 函 
数 lupSolve, 利 用 lu J pi 解 方程 组 ap=b。 第 37 FA 38 行 的 for 循环 调用 函数 horner, 计 
算 输出 pCs 十 1) ,…，,p(Cs 十 c) 。 

程序 4-10 存储 在 文件 夹 ch04\Complete the sequence 的 源 文件 Complete the sequence, c 中 。 


4.5.3 函数 的 有 理 式 逼 近 


Rational Approximation 


A polynomial p(x) of degree n can be used to approximate a function f(x) by setting 
the coefficients of p (x) to match the first n coefficients of the power series of f(x) 
(expanded about r=0). For example. 
1/0—2) 2 1-z-4z 4 42 
Unfortunately. polynomials are "nice" and they do not work well when they are used 
to approximate functions that behave poorly (e. g. those with singularities). To overcome 
this problem, we can instead approximate functions by rational functions of the form p(x)/ 


q(x), where p(x) and q(x) are polynomials. You have been asked by Approximate 
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Calculation Machinery to solve this problem, so they can incorporate your solution into 
their approximate calculation software. 

Given m .n and the first m+n coefficients of the power series of f (r).we wish to 
compute two polynomials p(x) and q(x) of degrees at most m —1 and n—1, respectively, 
such that the power series expansion of g(x) * f(x)— p(x) has 0 as its first m+n—1 
coefficients,and 1 as its coefficient corresponding to the z"*" ! term. In other words, we 
want to find p(x) and g(x) such that 

q(x)» f(x) — p(x) = zr) 十 … 
where ... contains terms with powers of x higher than m+n—1. From this. f(x) can be 
approximated by p(x)/q(x). 

Background Definitions 

A polynomial p(x) of degree n can be written as po + pix + paa? ++ + pax" , where 
pi's are integers in this problem. 

A power series expansion of f(x) about 0 can be written as fo + fix t fzx? ++, 
where /;'s are integers in this problem. 

Input 

The input will consist of multiple cases. Each case will be specified on one line.in the 
form m n fo fit fmtn-1 Where f; is the coefficient of x‘ in the power series expansion of 
f. You may assume that 1 m. 1 nz 4.25 m-- n9 10.and f; are integers such that 
{f:|<5. The end of input will be indicated by a line containing m = n = 0, and no 
coefficients for {. You may assume that there is a unique solution for the given input. 

Output 

For each test case. print two lines of output. Print the polynomial p(x) on the first 
line.and then q(x) on the second line. The polynomial p(x) should be printed as a list of 
pairs Cp; i) arranged in ascending order in i,such that p; is a non-zero coefficient for the 
term x'. Each non-zero coefficient p; should be printed as a/b. where 0 二 0 and a/b is the 
coefficient expressed in lowest terms. In addition.if b=1 then print only a (and omit b). 
If p(x) —0. print a line containing only (0.0). Separate the pairs in the list by one space. 
The polynomial g(a) should be printed in the same manner. Insert a blank line between 
cases. 

Sample Input 

220011 

4212345—2 

1123 

1 4 一 5 0 一 2 1 一 2 

00 


Sample Output 
(0,0) 
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(1,1) 


(—4/33,0) (—1/11,1) (—2/33,2) (—1/33,3) 
(—4/33,0) (5/33,1) 


(2/3,0) 
(1/3,0) 


(25/60) 
(—5/6,0) (1/3,2) (—1/6,3) 


1. 问题 的 理解 与 分 析 


已 知 函 数 Sa) = fo H fid t t+ fn | REAR pO — po pir t+ 


Pm x" R qG)—qo qa +g" | ,使 得 
g(x) * f(x) — plz) = m +e 


若 能 算出 p(w) 53 q(x). TERME LUN f(x) 在 z=0 的 附近 可 以 由 多 项 式 pa) 与 


qa HIRT pGOo/qGO3IXXr, PT 
qx) * f(x) — pGr) — (X aa')( b fix )- D pix 


E = S efus — Vee (利用 式 (4-20) ,对 


i=0 j=0 i=0 


mn-l i 
= M(Xafu-bh)  Æti>m, p =0) 
j=0 


i=0 


HE glr) * f(a) — pla) = amt! b -e R s i 


Mali —b =0 EE eee eee 
= 

min—l 

D ufe — Pere = 1 

f 


这 是 一 个 关于 m+n 个 未 知 数 qo squis Posts beca OR ETT FEH 
RUE E Mos» X G9 JÉ TIU 


fo 0 0 - 0 —1 0 0 
fi fo 0 … 0 0 —1 0 
fz fn fe. 0 0 0 —1 


f» fua o7 fo 0 0 
fa faa e othe 0 
fee) fem 0 fu 0 


fen) fex cocto fea 0 
fe fee Sm 0 


jzmnq;20 


。 该 方程 组 的 系 
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对 给 定 的 案例 数据 /一 ( fos fan futna) 72 和 7 可 用 如 下 过 程 生 成 矩阵 M。 


FORM-MATRIXCn «n; f) 

1 for i< 0 to m+n—1 

2 doif i>n—1 thent < n—1 

3 else t — i 

4 for j — 0 tot 

5 do M[i,jl-— fi-; 

6 — ifi-m then M[i,nai]——1 
7 return M 


算法 4-17 构成 合法 案例 min, 7 的 系数 矩阵 的 过 程 


4 x— (qos sqn- Pors psal b (0.77.0107 ,调用 过 程 LUP-DECOMPOSITION 


mna-1 


和 LUP-SOLVE 解 线性 方程 组 Mx = b. BI np 45 BE (B f f. p = C pos pui GQ = (qo rte 
Qai) 


2. 程序 实现 


1) 数据 类 型 的 定义 
由 于 题目 要 求 p, =O m=) GOG 一 0,…2 一 1) 表 示 成 有 理 数 形 式 ,所 以 首先 需 
要 定义 有 理 数 类 型 及 对 有 理 数 算术 运算 。 


1 typedef struct( 

2 unsigned numerator; /* 分 子 */ 

3 unsigned denominator; /* 分 母 */ 

4 char sign; /* 符 号 0 表示 正 ,1 表示 负 * / 
5 }Rational; /* 有 理 数 类 型 * / 

6 void printRational( Rational) ; /* 输出 有 理 数 * / 

7 int rationalIsZeroCRationaD ; / * 判断 有 理 数 是 否 为 0x*/ 

8 int valueCompare(Rational a, Rational b) ; / * 比较 有 理 数 绝对 值 的 大 小 * / 
9 Rational rationalSum(Rational , Rational) ; /* 计算 有 理 数 的 和 */ 

10 Rational rationalDiff( Rational, Rational) ; / * 计算 有 理 数 的 差 * / 

11 Rational rationalProd( Rational, Rational) ; / * 计算 有 理 数 的 积 / 

12 Rational rationalQuot( Rational, Rational ; / * 计算 有 理 数 的 商 / 


程序 4-11 有 理 数 类 型 的 定义 及 算术 运算 函数 声明 


对 程序 4-11 的 说 明 如 下 。 

CD 有 理 数 类 型 Rational 定义 成 具有 3 个 属性 (分 子 、 分 母 和 符号 ) 的 结构 体 (第 1 一 
547). 

(2) 第 6 一 8 行 声明 了 3 个 有 理 数 常规 维护 函数 : 打印 输出 的 printRational、 检 测 0 的 
rationallsZero 和 比较 两 个 有 理 数 绝对 值 大 小 的 valueCompare。 

G) 第 9 一 12 行 分 别 声明 了 对 有 理 数 进行 加 、 减 、 乘 、 除 运算 的 函数 rationalSum、 
rationalDiff,rationalProd 和 rationalQuot, 


程序 4-11 的 代码 存储 为 algebra 文件 夹 中 的 头 文件 rational. h, 各 函数 的 定义 代码 存储 
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为 同一 文件 夹 中 的 源 文件 rational. c。 为 节省 篇 幅 , 此 处 不 再 展开 这 些 代 码 ,读者 可 打开 文 
件 研读 。 
利用 Rational 类 型 ,定义 元 素 为 Rational 的 矩阵 类 型 。 


1 typedef struct{ 


2 Rational * tab; /* 二 维 数 表 * / 

3 int row, col; /* 行 数 , 列 数 * / 

4 jrMatrix; 

5 rMatrix rnewMatrix(int, int) ; /* 创建 0 矩阵 * / 

6 void rclrMatrix( rMatrix) ; /* 清 理 和 矩阵 存储 空间 * / 
7 void rswapRows(rMatrix a,int i,int j); /* 交换 两 行 * / 


程序 4-12 有理 数 和 矩阵 类 型 定义 


若 将 程序 4-12 与 程序 4-1 比较 ,读者 会 发 现 ,Matrix 类 型 与 rMatrix 类 型 区 别 仅 在 于 
BR tab 的 元 素 类 型 不 同 而 已 。 所 以 ,对 rMatrix 类 型 数据 的 操作 (第 5 行 声 明 的 矩阵 创建 
操作 rnewMatrix、 第 6 行 声明 的 矩阵 空间 清理 操作 rclrMatrix 及 第 7 行 声明 的 交换 矩阵 两 
行 元 素 的 操作 rswapRows) 与 对 Matrix 类 型 数据 的 相应 操作 十 分 相似 ,程序 4-12 的 代码 添 
加 在 algebra 文件 夹 中 的 头 文 件 matrix. h 内 ,各 函数 的 定义 代码 添加 在 同一 文件 夹 中 的 源 
文件 matrix. c 中 。 

2) LUP 分 解 函数 的 改造 

为 解 有 理 数 线性 方程 组 ,我 们 要 改造 程序 4-3 和 程序 4-4 中 定义 的 函数 lupDecomposition 
及 lupSolve, 改 造 后 的 函数 原型 声明 如 下 。 


rMatrix rlupDecomposition(rMatrix asint * pi); 
Rational * rlupSolve(rMatrix lu,int * pi, Rational * b); 


rlupDecomposition 及 rlupSolve 的 定义 代码 与 lupDecomposition X lupSolve 的 定义 十 分 接 
近 , 仅 将 对 浮 点 数 的 算术 运算 蔡 换 成 程序 4-11 中 声明 的 对 有 理 数 算术 运算 函数 的 调用 ,将 
交换 Matrix 两 行 的 交换 操作 替换 成 对 rMatrix 两 行 的 交换 操作 就 可 以 了 。 为 节省 篇 幅 起 
见 ,此 处 不 再 歼 述 。 上 述 这 两 个 函数 的 原型 声明 添加 在 algebra 文件 夹 中 的 头 文件 lup. h 
内 ,函数 定义 的 代码 添加 在 同一 文件 夹 的 源 文件 lup.c 中 。 

3) 问题 的 解 


1 rMatrix formMatrix(int m,int n,int * D( 

2 int i,j,t; 

3 rMatrix M=rnewMatrix(m+n,m+n); 

4 for(i—0 i m niic +){ 

5 t=C<n?it+1:n); 

6 for(j=0;j<tsj ++) { 

7 M. tab[i * (m+n) t-j]. numerator= (f[i—j]77 —0?1[i—j]: — Li 71 s 
8 ifd[i—j]<0) 

9 M. tab[ix (m+n) +j]. sign=1; 


11 if(i<m) 
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12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 


} 


} 


M. tab[i * (m+n)+n+i]. numerator=1, 
M. tab[i * (md- n) t- nt i]. sign=1; 


return M; 


int mainO { 


int m,n; 


FILE * f1=fopen("chap04/Rational Approximation/inputdata, txt" ,"r 


* {2=fopen("chap04/Rational Approximation/outputdata. txt" ,"w") ; 


assert f18.8-[2) ; 


fscanf(f1,"%d%d",&m,&-n); 


while(m! =08-.&n!=0){ 


int i, * f, * pispm,qn; 

rMatrix a,lu; 

Rational * b, * x; 

assert( f= (int * )calloc(m+n, sizeof(int) )) ; 


/ * 合法 案例 * / 


assert(b= (Rational * )callocCm 十 nysizeof(Rational) )) ; 


assert( pi— (int * )calloc(m+n, sizeof(int) )) ; 
for(i=0;i<m+n;i+ +) 
b[i]. denominator=1; 
b[m--n— 1]. numerator=1; 
for(i=0;i<m+n;it++){ 
ÍscanfCf1, " 4d" ,f+i); 
pili]=i; 
} 
a=formMatrix(m,n,f) ;free(f) ; 
lu= rlupDecomposition(a, pi) ;rclrMatrix(a) ; 
x=rlupSolve(lu, pi» b) ;rclrMatrixClu) ; 
pm 一 m 十 n 一 1; 
while( pm n8&- 8-rationalIsZero( x pm ])) 
pm—-—; 
if(pm— =n | ! rationallsZero(x[n])) ( 
ÍprintfCf2, " C) ; 
ÍprintRationalCf2, x(n]) ; 
fprintf(f{2,",%d) ",0); 
} 
forGi=n+1;i<mt+n;it++) 
if(!rationallsZero(xLi])) ( 
fprintf(f2,"("); 
ÍprintRationalCf2, xL i]) ; 
printfCf2,", 6d) ",i—m; 
} 
Íputc(An' £2) ; 
qn 一 n 一 1; 
while(qn 二 0& &-rationalIsZero(x[qn])) 


/ * 设置 向 量 b 一 (0,…,0,1) * / 


/* 读 取 案 例 数据 fost fees / 


/* 构 造 系数 矩阵 * / 

/* 对 a 进 行 LUP 分 解 */ 
/ * 解 方程 组 ax 一 bx / 

/ * 计算 pCx) 的 次 数 * / 


/* 输 出 p(x)*/ 


/* 计 算 q(x) 的 次 数 */ 
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57 qn——; 

58 if(qn— —0]| | !rationalIsZeroC x[ 0D) ( /* fli q(x) * / 
59 Íprint£C(f2, " (5 ; 

60 fprintRational({2,xL0]); 

61 ÍprintfCf2," , 96d) ",0); 

62 j 

63 for(i=1;i<n;it++){ 

64 if(! rationallsZero(xLi])) ( 

65 ÍprintfCf2, " C) ; 

66 ÍprintRationalCf2, x[ i] ; 

67 fprintf(f2,",%d) ",D; 

68 ) 

69 } 

70 fprintf({2,"\n\n") ; 

71 free(x) ;free( pi) ;free(b); 

72 fscanf(fl."%d%d".&m, &-n); /* 读 取 下 一 个 案例 */ 
73 } 

74 ÍcloseCf1) ; fclose(f2) ; 

75 return 0; 

76 } 


程序 4-13 ”解决 Rational Approximation 问题 的 C 程序 


对 程序 4-13 的 说 明 如 下 。 

(1) 第 1 一 16 行 定义 的 函数 formMatrix 实现 算法 4-15, 根 据 参 数 表 示 的 案例 数据 m 
nf 计算 该 案例 对 应 方程 组 的 系数 矩阵 。 程 序 代码 结构 与 算法 的 伪 代 码 结构 十 分 接近 , 读 
者 可 对 照 研读 。 

(2) 58 17— 76 行 定义 的 main 函数 将 调用 formMatrix, rlupDecomposition, rlupSolve 
等 函数 解决 Rational Approximation 问题 。 问 题 的 输入 数据 包含 于 文件 指针 £1 指向 的 磁 
HCE inputdata. txt 中 ,输出 数据 记录 在 文件 指针 f2 指向 的 磁盘 文件 12 中 。 

(3) 在 main 函数 中 ,第 23 一 73 行 的 while 循环 对 每 一 个 合法 的 案例 数据 (m,n,f) 重 复 
解 得 p(x) 和 q(x)。 其 中 ,第 30 一 32 行 完成 设置 向 量 5 二 (0,…,0,1)" 的 操作 。 第 33 一 36 
行 读 取向 量 S= fos fisto Snin) HIEMIS CR FLOR PET ICH. pi。 第 37 行 调用 函数 
formMatrix, 根 据 m,n, f 构造 线性 方程 组 的 系数 矩阵 a, 第 38 行 调用 rlupDecomposition 对 
a 进行 LUP 分 解 , 得 到 矩阵 lu 和 pi。 第 39 行 调用 函数 rlupSolve 解 方程 组 ax 一 b。 得 到 的 
ff 2 = (qo equa spot Pm)" s 58 40—42 FFT p(x) 的 次 数 pm, 根 据 pm 的 值 决定 是 
否 输出 po (第 43 一 47 行 ) ,第 48 一 53 行 依次 输出 pie ,pm-1 中 的 非 0 项 。 第 55 一 69 行 输 
出 q(x) ,过 程 与 上 述 输出 p(x) 的 类 似 ,读者 可 对 照 研读 。 循 环 体 中 最 后 (第 72 行 ) 在 输入 文 
件 中 读 取 下 一 个 案例 的 数据 m、n。 

程序 4-15 的 代码 存储 于 文件 夹 chap04\Rational Approximation 的 源 文件 RationalApproxi- 


mation. c 中 。 
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计算 几何 是 计算 机 科学 中 研究 解决 几何 问题 算法 的 一 个 分 支 。 在 现代 工程 与 数学 
中 ,计算 几何 应 用 于 计算 机 图 形 学 、 机 器 人 技术 、 大 规模 集成 电路 设计 、 计 算 机 辅助 设计 
以 及 统计 学 等 多 种 领域 。 计 算 几 何 问题 的 输入 往往 是 一 个 描述 性 的 几何 对 象 的 集合 ,i 
如 点 的 集合 、 直 线段 的 集合 或 是 按时 针 方向 排列 的 多 边 形 顶 点 。 输 出 通常 是 对 那些 对 象 
询问 的 回应 ,如 各 条 直线 是 否 相 交 ? 或 是 另 一 个 新 的 几何 对 象 ,如 点 集 的 凸 沉 (最 小 的 封 
闭 凸 多 边 形 ) 。 

本 章 讨论 一 些 平面 上 的 计算 几何 算法 。 每 一 个 输入 的 对 象 表 示 为 点 的 集合 {pi, ps， 
picti ,其 中 每 一 个 pim Gu y) H ry ER, 例如 ,n 个 顶点 的 多 边 形 P 表示 为 其 边界 上 
的 nn 个 顶点 按 出 现 的 顺序 构成 序列 {po ,pi ,ps，…,ps-1)。 计 算 几 何 也 可 以 用 于 三 维 ,甚至 
更 高 维 的 空间 ,然而 这 样 的 高 维 空间 中 的 问题 及 其 解 都 很 难 形象 化 ,而 在 二 维 空间 中 却 可 以 
看 到 一 个 很 好 的 例子 。 


5.1 线段 的 性 质 


本 章 的 几 个 计算 几何 算法 都 要 求 回答 关于 线段 的 性 质问 题 。 两 个 不 同 的 点 pi = Gn 
MAM po — (x2, y2) ,任何 满足 ,0 二 a 志 1,xs — adi + (1 —a)22 sys =ayı + 1—a) yn 的 点 ps = 
(za ,ys BON pi ops 的 凸 组 合 。 也 可 以 写成 p3 二 api 十 (1 一 a)ps。 直 观 地 说 ,ps 是 pi M pe 
连 线 上 介 于 p 和 p. 之 间 的 点 。 给 定 两 个 点 py po BBE pps 是 i ps HAA MISES 
称 pi «ps 为 线段 1ps 的 端点 。 有 时 ,要 考虑 ps ps 的 顺序 ,人 们 就 称 其 为 有 向 线段 pp;。 若 
Pr 是 原点 (0,0), 人 们 把 有 向 线段 方太 视 为 向 量 poo 

在 本 节 中 ,将 探索 以 下 问题 。 

(1) 给 定 两 条 有 向 线段 Po 所 和 po 所 ,po 是 否 绕 它 们 的 公共 端点 po Mpo be MOLI FEF i 
旋转 而 得 ? 

(2) By E R BE bi p» 和 psps, 如 果 先 沿 p1p: 行 进 再 沿 psps 行 进 是 否 需 要 在 点 po 处 左 
转弯 ? 

(3) 线段 pips 和 psps 是 否 相 交 ? 

由 于 每 个 问题 的 输入 规模 都 是 OC ,无 疑 均 可 在 O(1) 的 时 间 内 得 到 回答 。 此 外 ,这 个 
方法 将 仅 使 用 加 法 ,减法 、 乘 法 和 比较 运算 。 既 不 需要 除法 也 不 需要 三 角 函 数 ,这 两 种 运算 
都 很 费时 且 容易 产生 舍 入 误差 。 例 如 ,用 “直接 ”方法 判断 两 条 线段 是 否 相交 一 一 计算 每 条 
线段 的 直线 方程 y 二 mz 十 blm 为 斜率 ,6 J y 轴 上 的 截 距 ), 求 出 两 直线 的 交点 并 检测 该 交 
点 是 否 在 两 条 线段 中 。 这 就 需要 使 用 除法 , 当 两 条 线段 几 乎 平行 时 ,在 实际 的 计算 机 中 此 问 
题 对 除法 运算 的 精度 是 很 敏感 的 。 本 节 中 的 方法 避免 了 除法 ,因此 更 加 精确 。 
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5.1.1 又 积 及 其 应 用 


1. RR 


叉 积 的 计算 是 解决 上 述 线段 问题 的 方法 之 核心 。 考 虑 两 个 向 量 p 和 ps ,如 图 5-1(a) 
所 示 。 叉 积 pi X ps 可 以 解释 为 由 点 (0,0) 、pi、ps El pi + pe — Gr bas yi 十 ys) 构成 的 平 
行 四 边 形 的 带 符号 面积 。 一 个 等 价 的 且 更 有 用 的 定义 是 叉 积 是 下 列 算 阵 的 行列 式 ?; 
Pi X P= af” ~] 
n i 
= Ziyz — X3yi 
——pXph 
图 5-1(a) 所 示 为 向 量 py 和 ps 的 又 积 ,是 平行 四 边 形 的 带 符号 面积 。 图 5-1(b) 中 的 浅 
阴影 区 域 包 含 由 向 量 p 出 发 顺 时 针 旋 转 的 所 有 向 量 , 而 深 阴 影 部 分 则 包含 从 向 量 p 出 发 反 
时 针 旋 转 的 所 有 向 量 。 


PtP 


图 5-1 向 量 及 其 叉 积 


利用 对 向 量 又 积 的 定义 ,下 列 定理 是 很 有 用 的 。 

定理 5-1 假定 向 量 pi Al ps 所 张 角 介 于 0 一 x 之 间 ,. 则 : 

COD 车 pi X ps 为 负 当 且 仅 当 p; 是 从 p; 反 时 针 方 向 旋转 而 得 ; 

(2) 车 pi X ps 为 正当 且 仅 当 pr 是 从 ps 绕 原点 (0,0) 顺 时 针 方向 旋转 而 得 ; 

(3) 38 pi X ps 为 零 , 则 产生 边界 条 件 ,此 时 ,两 个 向 量 共 线 ,或 方向 一 致 或 方向 相反 。 

图 5-2 形象 地 说 明了 定理 5-1。 

图 5-2(a) 所 示 向 量 pi 是 从 ps 反 时 针 方 向 旋转 而 得 。 平 行 四 边 形 Op: ps js 的 面积 一 
三 角形 Opi pi 面积 十 梯形 pi ps ps pi — = SIE Op; ps 一 梯形 pspspsps 二 zy1/2 十 zo(2yi 十 
y2)/2—zx2y2/2— ax (2y: +y1)/2= zy 一 zy 二 0。 图 5-2(b) 中 向 量 户 是 从 ps 反 时 针 方 
向 旋转 而 得 。 平 行 四 边 形 Op. p. py 的 面积 = 梯形 pz pz ps ps if B+ BRIE pi ps pr bi — — E 
pipiO 面积 一 三 角形 Op, pi = — y (222 +22)/24+ 和 (2z 十 za)/2 一 zy/2 十 mi yi /2— 
Tiye ry > 0. K 5-2(c) 向 量 pip: FEB. y2/t2= yi /x1> 1291-1192 70. 

利用 定理 5-1, 可 直接 判定 有 向 线段 六 让 是 否 从 有 向 线段 广大 绕 它们 的 公共 端点 po M 


Q ”事实 上 ,又 积 是 一 个 三 维 概念 。 它 是 一 个 按 * 右 手法 则 " 既 垂 直 于 p 又 垂直 于 p: HAR HAKA |y: ry l. 
然而 ,本 章 的 内 容 说 明 , 将 叉 积 视 为 值 riyz 一 zzyi 是 方便 的 。 
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pits yy) 
pios V2) 


PAX) 


(b) (c) 
图 5-2 
时 针 旋 转 而 得 。 为 此 ,只 要 将 po 转换 为 原点 。 即 设 pi 一 po 表示 向 量 py = Cay yD SEH 
atas a 及 六 Y 二 一 yo。 类 似 地 ,定义 ps 一 po。。 然 后 计算 叉 积 : 
(pi Po) X (P2 Po) Gr Xo)Cy; — yo) — Gr; — T0) (yı yo) 
如 果 此 叉 积 为 正 , 则 po 户 是 从 有 向 线段 po 户 绕 它们 的 公共 端点 po 顺 时 针 旋转 而 得 ; 若 为 负 ， 
则 为 道 时 针 方 向 。 


2. 判断 相继 两 直线 段 左 转 或 右 转 


下 一 个 问题 是 两 条 相继 线段 pop1 和 pip: 是 在 点 py 处 左 转 还 是 右 转 。 等 价 地 ,要 设法 判 
EREM popi pz 的 转向 。 叉 积 使 得 我 们 可 以 不 计算 角 而 回答 此 问题 。 


DIRECTION( po » pi » p2) Dit po pi 、pi1p: 的 转向 
1 return (5; — po) X (pi— po) 


算法 5-1 HMR ps eps HEI 


如 图 5-3 JR AS « ELAR RM AG Ui] AR BE po ps SEAT Wi] AR Et po pi Je LIE EE JE IST PP e e T 
得 。 为 此 ,计算 丸 积 (ps 一 po)X Gi — po)» FFE BUN He IM po p; EIA Td BBE po pi WEIN EE 
旋转 而 得 的 ,因此 在 p. 处 左 转 。 正 的 又 积 值 意味 着 顺 时 针 并 p, A 
Tdi. SUBUM 0 意味 着 popi 和 ps 共 线 。 


pn Pi 
图 5-3 所 示 为 使 用 叉 积 判断 相继 线段 popi、pips 在 pr 处 
的 转向 。 检 测 有 向 线段 po 户 是 从 po 六 顺 时 针 还 是 道 时 针 旋转 Po Po 
而 得 。 图 5-3(a) 若 是 道 时 针 , 则 在 该 点 处 左 转 。 图 5-3(b) 若 | UU 
是 顺 时 针 , 则 为 右 转 。 Er DONE 


3. 判断 两 条 线段 是 否 相交 


为 确定 两 条 线段 是 否 相 交 , 检 测 每 条 线段 是 否 跨 越 包含 另 一 条 线段 的 直线 。 线 段 户 思 
的 端点 pi 位 于 一 条 直线 的 一 边 ,而 端点 po 位 于 另 一 边 , 则 该 线段 跨越 此 直线 。 若 pi 或 pe 
位 于 直线 上 则 发 生 边 界 情形 。 两 条 线段 相交 当 且 仅 当 下 列 两 个 条 件 至 少 发 生 一 个 。 

CD 每 一 条 线段 跨越 包含 另 一 条 线段 的 直线 。 

(2) 一 条 线段 的 一 个 端点 位 于 另 一 条 线段 上 。 

下 列 过 程 实现 了 这 一 思想 。 若 两 条 线段 相交 ,SEGMENTS-INTERSECT 返回 TRUE, 若 
不 相交 ,返回 FALSE。 它 调用 子 过 程 DIRECTION, 该 过 程 利用 上 述 的 又 积 方法 计算 相对 方 


220 


第 5 章 计算 几何 


位 ,还 要 调用 子 过 程 IN-BOX ,该 过 程 确定 一 个 点 是 否 落 于 以 已 知 线段 为 对 角 线 的 矩形 内 。 


SEGMENTS-INTERSECT( fi , f» «ps + Ps) 上 检测 线段 户 p. 5 ps p. JE RE 
d, —DIRECTION( ps » i + p1) S VENIS] 
d; —DIRECTION( ps » pi + p2) DERE p. ps El pe ps HF 18] 
d; —DIRECTION( pi » p» + ps) DIM p. p. Sl ps pi fU RE f] 


1 

2 

3 

4 d,--DIRECTION( Ai » pz» pi) 户 计算 pp1 到 psp 的 转向 
5 if (Cd; * d 0) and (d; * d <0)) 
6 

7 

8 

9 


then return TRUE 
elseif d; —0 and IN-BOX(); » p4 » p1) 
then return TRUE 
elseif d; —0 and IN-BOX(); » p4 » p2) 
10 then return TRUE 
11 elseif d; —0 and IN-BOXCpi » p2 » p3) 
12 then return TRUE 
13 elseif d, —0 and IN-BOX( pi » p2 » p4) 
14 then return TRUE 
15 else return FALSE 
IN-BOX( 2; » p; + Ps) DRWA p, JE ABT Dp p; RE MAR RE V 


l if minCz, ,2;)<a,<max(a;,2;) and min(y, , y; ) & y, & max( y, + yj) 
2 then return TRUE 
3 else return FALSE 


算法 5-2 检测 两 条 线段 是 否 相交 的 算法 


图 5-4 所 示 为 过 程 SEGMENTS-INTERSECT 中 的 各 种 情形 。 图 5-4 C WR BE ps ps 和 
psp4 相 互 跨 越 对 方 所 在 直线 。 由 于 ps ps 跨越 包含 p1ps 的 直线 , 叉 积 (ps 一 p1) X Ops — pi Y RI 
(Pa Pr) X (ps 一 pi) 的 符号 相反 。 由 于 pips 跨 越 包含 psps 的 直线 , 叉 积 (pi 一 ps) X Cp. — 
ps) 和 (ps 一 ps)X(ps 一 ps) 的 符号 相反 。 图 5-4(b) 为 线段 pp 跨越 包含 pips 的 直线 ,但 
ps 并 不 跨越 包含 pspi 的 直线 。 叉 积 (pi 一 ps) X (ps 一 ps) 和 (ps 一 ps)X (ps 一 ps) 的 符号 
相同 。 图 5-4(c) 为 点 ps 与 py 和 ps 共 线 且 介 于 两 者 之 间 。 图 5-4(d) 为 点 ps 与 pips 共 线 ， 
但 它 并 不 介 于 pi 和 p. 之 间 。 两 条 线段 不 相交 。 

SEGMENTS-INTERSECT 运行 如 下 。 第 1 一 4 行 计算 每 一 个 端点 p; 关于 其 他 线段 的 相 
对 方位 d;。 车 所 有 的 相对 方位 非 零 , 则 不 难 确定 两 条 线段 pps 和 psps 是 否 相 交 。 若 有 向 线 
段 ps 扬 和 ps 刀具 有 相对 于 Psp 的 正 的 方位 ,线段 pp 跨越 包含 线段 psp4 的 直线 。 此 时 ,di 
和 ds 的 符号 相反 。 相 似 地 ,车 ds 和 ds 的 符号 相反 , 则 psps 跨 越 包 含 pps 的 直线 。 若 第 5 
行 的 检测 为 真 , 则 两 线段 相互 跨越 . 且 SEGMENTS-INTERSECT 返回 TRUE。 图 5-4(a) 展 示 
了 此 情形 。 和 否则 ,两 条 线段 并 不 相互 跨越 对 方 所 在 的 直线 ,但 可 能 会 发 生 边界 情形 。 若 所 有 
的 相对 方位 均 非 零 , 没 有 边界 情形 发 生 。 若 第 7 一 13 行 的 所 有 对 0 的 测试 都 失败 , 则 
SEGMENTS-INTERSECT 在 第 15 行 返回 FALSE。 图 5-4(b) 展 示 了 这 一 情形 。 

任 一 相对 方位 d, 为 0, 则 发 生 边界 情形 。 此 时 ,知道 p, 与 男 一 条 线段 p;p; 共 线 。 过 程 
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(pip) X (PP) Ps 
Pi (pi-p)X (;-p)«0 


Pr 
-pX (pp)>0 
Cr PUE RUP 5 (psp) (ps-p;>0 


5-4 平面 上 两 条 线段 的 相交 的 各 种 情形 


IN-BOXC p» p; ,pr) 返 回 p, 是 否 介 于 线段 六方 的 两 个 端点 之 间 ; 该 过 程 假定 p 与 ;pj 共 线 。 
图 5-4(c) 和 图 5-4(d) 展 示 了 共 线 点 的 情形 。 在 图 5-4 CO 4, ps 在 pips 上 ,所 以 SEGMENTS- 
INTERSECT 在 第 12 行 返回 TRUE。 在 图 5-4(d) 中 ,没有 端点 在 另 一 条 线段 上 ,所 以 
SEGMENTS-INTERSECT 在 第 15 行 返回 FALSE. 


5.1.2 向 量 的 极 角 


在 一 些 几何 算法 中 常用 到 极 角 的 概念 。 把 向 量 pi 一 po 与 x 正 半 轴 的 夹 角 称 为 点 pi K 
于 点 po 的 极 角 。 例 如 ,(3,5) 关 于 (2,4) 的 极 角 是 向 量 (1,1) 与 x 正 半 轴 的 夹 角 45° 或 x/4 
弧度 。(3,3) 关 于 (4,2) 的 极 角 是 向 量 ( 一 1.1) 与 zx 正 半 轴 的 夹 角 135° 或 3x/4 弧度 。 

算法 中 常 需要 比较 两 个 向 量 极 角 的 大 小 。 数 学 中 ,要 计算 每 个 向 量 与 x 正 半 轴 夹 角 的 
正切 值 > 一 六 ,然后 利用 反正 切 两 数 arctan 以 及 向 量 所 在 的 象限 计算 出 极 角 。 下 面 考虑 一 
种 不 使 用 三 角 函 数 和 反 三 角 函 数 ,而 比较 向 量 间 极 角 大 小 的 方法 。 不 失 一 般 性 , 设 非 零 向 量 
pay WEBS | pl Cp 到 原点 O 的 距离 Vr ty) H 1. (如果 |p| 关 1, 可 按 下 述 方法 进行 规格 


th: © armanpl- (re) rom sen ir = 1012 atis 


正 半 轴 的 夹 角 为 a。 设 p. C100 29 ac li ES AE E iA Ceo syo) ,其 与 x 轴 正 向 夹 角 B = 
0。 由 于 p、po 都 是 规格 化 了 的 向 量 , 所 以 zx 一 cosa,y 一 sina,zo 一 cosp,y 一 sin8。 考 虑 又 积 
Po X p= yro — xyo 
= sinacosB— cosasinf? 
= sin(a — B) 
— sina 
在 数学 中 ,单位 圆 上 的 弧 长 a 较 小 时 (0 二 a 二 x/2) sin~a, ^5 p 位 于 第 I 象限 时 ,如 
图 5-5(a) 所 示 , 就 用 y==sina 替代 p 的 极 角 a。 当 p 位 于 第 上 [象限 时 ,如 图 5-5(b) 所 示 ， 
sina 二 sin(x/2 十 a)。 此 时 ,用 x/2 一 z 替代 pp 的 极 角 a。 当 zp 位 于 第 肯 象 限时 ,如 图 5-500) 
所 示 ,sina 二 sin(x 十 a )。 此 时 ,用 x 一 y BAR p 的 极 角 a。 当 位 于 第 NN 象限 时 ,如 图 5-5(d) 
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所 示 ,sina 二 sin(3x/2 十 a )。 此 时 ,用 3x/2 十 z 替代 pp 的 极 角 a。 

图 5-5 所 示 为 规格 化 向 量 p 与 po 一 (1,0) 的 又 积 与 极 角 的 关系 。 图 5-5(a) 中 ,p 位 于 
第 I 象限 ,po X p sina, Fl 5-50) P, p 位 于 第 [象限 ,po Xp 二 sinq 二 sin(x/2 十 a)。 图 5-500) 
中 ,p 位 于 第 上 象限 ,po。 X p=sina=sin(x+a’), A5-5(d) Pop 位 于 第 人 象限 ,po X p= 
sina=sin(3r/2+a'). 


x 


(a) 


图 5-5 叉 积 与 极 角 的 关系 


这 样 , 无 须 真正 计算 出 p 的 极 角 , 却 可 以 对 两 个 规格 化 后 的 向 量 比较 极 角 的 大 小 。 把 
上 述 替 代 极 角 的 值 称 为 向 量 的 伪 极 角 。 下 列 过 程 描述 了 计算 向 量 p 相对 于 po 的 伪 极 角 
( 即 向 量 p— po 的 伪 极 角 ) 算 法 。 

PSUDO-POLAR-ANGLE(p, po ) 

1 pi (ay d= pr po 


2 将 p, 规格 化 

3 if 1>0 H yı >0 DT MPR 
4 then return y, 

5 if <0 H 二 0 DT MPR 
6 then return z/2— zi 

5 if zı <0 H <0 DRRR 
7 then return x— y; 

8 return 3x/2+2 上 > 第 人 象限 


算法 53 计算 向 量 p 一 ps 的 伪 极 角 
5.1.3 程序 实现 


1. 平面 中 点 的 数据 表示 
实现 平面 上 点 的 数据 类 型 如 下 。 


1 # define epsilon le 一 10 

2 £define PI 3. 1415926 

3 typedef struct( /* 平 面 点 */ 

4 double x,y; /* 横 坐 标 与 纵 坐 标 * / 
5 jPoint; 

6 double dist(Point * a,Point * b){ /* 两 点 间距 离 */ 

7 return sqrt( pow(a-» x— b-» x.2) +pow(a->y— b-» y.2)); 

8 } 

9 Point sub(Point * a,Point * b){ / * 两 点 向 量 差 */ 
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10 Point c={a->x—b->x,a->y—b->y); 

11 return c; 

12) 

13 double crossProduct(Point * a.Point * b){ /*XB«/ 
14 return a-»x * b-»y—a-»y * b->x; 

15 } 


程序 5-1 平面 点 数据 类 型 及 常规 维护 函数 


程序 5-1 的 说 明 如 下 。 

CD 第 3 一 5 行 定义 了 表示 平面 上 点 的 结构 体 类 型 Point。Point 类 型 的 数据 具有 2 个 
double 型 的 数据 属性 : 点 的 横 坐 标 x 和 纵 坐 标 yo 

(2) 第 6 一 8 行 定 义 的 函数 dist 计算 由 参数 a、b 指引 的 两 个 Point 点 之 间 的 距离 。 第 
9 一 12 行 定义 的 函数 sub 计算 由 参数 a、b 指引 的 两 个 Point 点 按 坐标 差 计 算 所 得 的 点 
(向 量 ) 。 

(3) 第 13 一 15 行 定 义 的 函数 crossProduct 计算 由 参数 a、b 指引 的 两 个 Point 点 (向 量 ) 
的 叉 积 。 

所 有 这 些 函 数 的 定义 代码 都 十 分 简单 ,读者 不 难 阅 读 理解 。Point 类 型 的 定义 及 各 函 
数 的 原型 声明 存储 于 文件 夹 geometry 的 头 文件 point. h 中 ,函数 的 定义 存储 于 同一 文件 夹 
的 源 文件 point. c 中 。 


2. 利用 又 积 检测 线段 性 质 


DIRECTION 过 程 和 算法 5-2 描述 的 SEGMENTS-INTERSECT 过 程 。 


1 int direction Point * p0,Point * pl,Point * p2){ /x 计算 向 量 pipi .pp 的 夹 角 方 向 * / 


2 Point p— sub(p2, p0) ,q— sub(pl.p0) ; 

3 double d=crossProduct(&-p, &-q) ; 

4 if(d>0. 0) /* 顺 时 针 */ 

5 return 1; 

6 if(d<0. 0) / x Mitt / 

id return—1; 

8 return 0; /* 共 线 */ 

9 } 

10 int inBox(Point * pi,Point * pj,Point * pk)( — / * fill pk FV pi. pj 为 对 角 线 的 矩形 内 * / 
11 double xl =pi->x<pj->x?pi->x:pj-> X, 

12 x2— pi-» x> pj-» x?pi-» x:pj-» X» 

13 yl-— pi-» y« pj-» y?pi-» y:pj-» y. 

14 y2— pi-» y2" pj-» y?pi-»y:pj-»y: 

15 return x1— — pk-» x8 &-pk-> x< = x28. & y1— — pk-» y&8.pk-» y — y2; 
16 ) 


17 int segmentsIntersect(Point * pl,Point * p2,Point * p3,Point * p4){ 
18 int d1— direction(p3. p4 , p1) , 
19 d2— direction( p3. p4 , p2) 
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20 d3-— direction( pl.p2.p3) . 
21 d4— direction pl. p2.p4) ; 
22 if(dl= —08.&inBox(p3. p4 . p) 
23 return 1; 

24 if(d1= =08.&inBox(p3,p4,pl)) 
25 return 1; 

26 if(d2= =08.8-inBox(p3,p4,p2)) 
27 return 1; 

28 if(d3 = =08.&inBox(p1,p2.p3)) 
29 return 1; 

30 if(d4= =08.8-inBox(p1,p2,p4)) 
31 return 1; 

32 return 0; 

33) 


程序 5-2 实现 算法 5-1 和 算法 5-2 的 C 函数 


对 程序 5-2 的 说 明 如 下 。 

COD 第 1 一 9 行 定义 的 函数 direction 实现 算法 5-1 的 DIRECTION 过 程 ,计算 由 指针 参数 
p0.pl.p2 指引 的 3 个 点 构成 的 两 条 连续 线段 加 证 和 户 思 的 转向 。 第 2 行 调用 程序 5-1 中 
定义 的 函数 sub, 计算 向 量 pe — po Al pi — pos DART p Al gq. 5B 3 (38 HL ER Be 
crossProduct FERE Cp: — po) X (pi 一 po) 并 赋予 d。 为 便于 使 用 ,函数 并 不 直接 返回 d. 
而 是 根据 d 的 符号 返回 1 或 0 或 一 1。 

(2) 第 10 一 16 行 定 义 的 函数 inBox 实现 算法 5-2 中 IN-BOX 过 程 , 检 验 由 指针 参数 pk 
指引 的 点 pk 是 否 落 在 由 指针 参数 pi pj 指引 的 点 连 成 的 线段 pp; 作 为 对 角 线 的 矩形 内 。 其 
中 ,第 11 一 14 行 计算 minGe; «x;) smax(2;+2;) minl y: sy) Al max(y;+y,;) > HMR x1 、x2、 
yl.y2. 58 15 行 检测 条 件 minlar; x; ) Sr, S maxlas xj) A minCy; » y) S y, & max(y; « yj) 
并 返回 检测 结果 (条 件 成 立 返回 1 否则 返回 0) 。 

(3) 第 17 一 33 行 定 义 的 函数 segmentsIntersect, 实现 算法 5-2 中 的 SEGMENTS- 
INTERSECT 过 程 ,检测 由 指针 参数 pl p2. p3 和 pa 指引 的 点 构成 的 线段 p1ps 与 psps 是 否 相 
交 。 程 序 代 码 结构 与 算法 的 伪 代 码 结构 十 分 接近 ,读者 可 对 比 阅 读 , 此 处 不 再 熬 述 。 


3. 向 量 的 伪 极 角 


1 double pabs(Point * a){ /* 计 算 向 量 的 模 * / 

2 Point o= {0. 0,0. 0}; /* 原 点 */ 

3 return dist(a, &0); 

4j 

5 void normalize(Point * a){ /向 量 正规 化 ( 模 长 为 1)*/ 

6 double r= pabs(a); 

7 if(r>=epsilon) /x* 非 0 向 量 x/ 

8 a-»x/—r,a-»y/—r; 

9) 

10 double psudoPolarAngle(Point * a.Point * b){ /*#* 计 算 向 量 a 关于 向 量 b 的 极 角 * / 
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11 Point pl—sub(a.b) ; 


12 normalize( &-p1) ; 

13 if(pabs( &p1)<epsilon) 

14 return 2 * PI; 

15 if(pl. y>=0. 08-8 pl. x>=0. 0) /*Pp 位 于 第 I 象限 */ 
16 return pl. y; 

17 if(pl. y>=0. 08.8 pl. x<0. 0) /* p FERR / 
18 return PI/2— pl. x; 

19 if(pl. y<0, 08 & pl. x<0, 0) /* pF MRP * / 
20 return PI— pl. y; 

21 return 3 * PI/2+pl. x; /* p fF WV BPR * / 
22) 


程序 5-3 ”实现 算法 5-3 计算 向 量 a 关于 向 量 b 的 极 角 的 PSUDO- POLAR-ANGLE 的 函数 


对 程序 5-3 的 说 明 如 下 。 

CD 第 1 一 4 行 定义 的 函数 pabs 计算 由 指针 参数 a 所 指引 的 点 到 原点 的 距离 
到 该 点 形成 的 向 量 的 模 。 

(2) 第 5 一 9 行 定义 的 函数 normalize 对 指针 参数 a 指引 的 点 构成 的 向 量 做 规格 化 操 
作 一 一 使 其 模 为 1。 

(3) 第 10 一 22 行 定义 的 函数 psudoPolarAngle 实现 算法 5-3 的 PSUDO-POLAR-ANGLE 
过 程 ,计算 由 指针 参数 a、b 指引 的 点 构成 的 向 量 伪 极 角 。 程 序 代 码 结构 与 算法 的 伪 代 码 结 
构 十 分 接近 ,读者 可 对 照 阅读 。 

程序 5-2 和 程序 5-3 中 定义 的 各 函数 均 存储 于 geometry 文件 夹 的 源 文件 point. c (P. 
各 函数 的 原型 声明 存储 于 同一 文件 夹 的 头 文件 中 。 


原点 


5.2 判断 是 否 存在 线段 相交 


判断 线段 是 否 相 交 的 问题 可 如 下 形式 化 。 

输入 : 线段 集合 S= {51 esos she 

输出 : 如 果 S 中 存在 两 条 线段 相交 ,输出 布尔 值 TRUE ,否则 输出 FALSE, 

本 节 介绍 一 个 判断 线段 集合 中 任意 两 条 线段 是 否 相 交 的 算法 。 该 算法 用 到 一 种 称 为 
“扫描 ”的 技术 ,该 技术 对 很 多 计算 几何 算法 都 适用 。 该 算法 的 运行 时 间 是 O(nlgn) SEA n 
是 所 给 的 线段 数 。 算 法 仅 判 断 是 否 有 线段 相交 ,并 不 输出 任何 具体 的 相交 情形 。 

在 扫描 过 程 中 ,一 条 假想 的 扫描 线 从 左 向 右 扫 过 给 定 的 几何 对 象 集合 。 扫 描 线 的 运动 
方向 是 z 轴 , 把 它 视 为 时 间 轴 。 通 过 将 几何 对 象 置 于 动态 数据 结构 内 ,并 利用 对 象 间 的 关 
系 , 扫 描 提 供 了 一 种 对 几何 对 象 的 排序 方法 。 本 节 的 线段 相交 算法 按 从 左 到 右 的 顺序 考虑 
所 有 线段 的 端点 并 在 每 遇 到 一 个 端点 时 检测 相交 性 。 

为 简化 描述 确定 n 条 线段 是 否 有 相交 情形 的 算法 并 证 明 其 正确 性 ,要 做 两 个 前 提 假 设 。 
首先 ,假设 输入 的 线段 没有 垂直 的 。 其 次 ,假设 没有 三 条 线段 相交 于 一 点 。 
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5.2.1 算法 描述 与 分 析 


1. 线段 排序 


由 于 假设 没有 垂直 的 输入 线段 ,任何 输入 线段 与 给 定 的 垂直 扫描 线 至 多 有 一 个 交点 。 
因此 可 以 按 线段 与 扫描 线 上 的 交点 的 纵 坐 标 对 线段 排序 。 

更 准确 地 说 ,考虑 两 条 线段 s; 和 。 如 果 在 横 坐 标 x 处 的 垂直 扫描 线 与 两 者 均 相交 ， 
则 说 此 两 线段 在 处 可 比 。 若 ms: 在 工 处 可 比 , 且 s 与 扫描 线 的 交点 高 于 s 与 扫描 线 的 
交点 , 则 称 在 + 处 5 在 ss 之 上 , 记 为 >ss。 例 如 ,在 图 5-6(a) 中 ,有 关系 a>, a>b,b 
> c.a>c A b.c, RB d 与 其 他 线段 不 可 比 。 

对 任意 给 定 的 x ER EMA TE x 处 与 扫描 线 相交 的 线段 的 一 个 全 序 关 系 。 在 不 
同 的 z 处 ,线段 进入 的 序 和 离开 的 序 可 能 是 不 同 的 。 当 线段 的 左 端点 遇 到 扫描 线 时 进入 
序 ,而 当 右 端点 遇 到 扫描 线 时 离开 序 。 

当 扫 描 线 通 过 两 条 线段 的 交点 时 会 发 生 什么 呢 ? 如 图 5-6(b) 所 示 ,它们 的 位 置 在 全 序 
中 是 相反 的 。 扫 描 线 Al w 分 处 于 线段 。 和 上 的 交点 的 两 边 , 有 em. BI fue. HHP IB 
定 了 没有 三 条 线段 共 点 , 必 有 某 扫描 线 x 使 得 相交 线段 。 A Sf EES, 中 是 挨 着 的 。 任 
何 通过 图 5-6(b) 的 阴影 区 域 的 扫描 线 , 如 <z、e 和 /在 此 全 序 中 是 紧 挨 着 的 。 


EET 


a | h a 


l | 
1 
1 1 fi 
| l | 
r t u v 


(a) 
图 5-6 线段 关于 垂直 扫描 线 的 序 


1 
1 
| 
b 


图 5-6 所 示 为 线段 关于 垂直 扫描 线 的 序 。 图 5-6(a) 中 有 a>,c.a>b.b>c.a>c VÀ 
及 0 二.c。 线 段 d 与 其 他 线段 不 可 比 。 图 5-6(b) 中 , 当 线段 ec 和 三 相交 时 ,它们 的 序 是 颠倒 
的 : A e> f 和/ 记 we。 任 何 通 过 阴影 区 域 的 扫描 线 ( 如 <) 总 使 得 e 和 /在 全 序 中 是 紧 挨 
着 的 。 


2. 移动 扫描 线 


扫描 算法 通常 处 理 两 个 数据 集合 。 

(1) 扫描 线 状态 给 出 与 扫描 线 相交 的 对 象 间 的 关系 。 

(2) 事件 点 进度 表 是 一 组 按 从 左 向 右 顺序 模 坐 标 序列 , 定义 了 扫描 线 的 暂停 位 置 , 称 
这 样 的 暂停 位 置 为 事件 点 。 只 有 在 事件 点 处 才 发 生 扫描 线 状 态 的 改变 。 

在 这 个 算法 的 事件 点 进度 表 中 ,每 一 个 线段 的 端点 为 一 个 事件 点 。 将 各 线段 的 端点 按 
横 坐 标 递增 排序 ,从 左 向 右 逐 一 处 理 ( 若 两 个 以 上 端点 共 坚 线 , 即 它们 有 共同 的 z 坐标 , 按 
左 端点 先 于 右 端 点 ,对 所 有 的 共 坚 线 左 端点 , 按 小 > 坐标 先 于 大 y 坐标 来 打破 僵局 ) 。 当 遇 
到 一 条 线段 的 左 端点 时 ,将 其 插入 到 扫描 线 状 态 ,而 当 遇 到 该 线段 的 右 端点 时 ,从 扫描 线 状 
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态 中 将 其 删除 。 只 要 两 条 线段 变 为 紧 挨 着 的 全 序 ,就 检测 它们 是 否 相 交 。 

扫描 线 状 态 是 一 个 全 序 工 ,对 其 需要 如 下 操作 。 

(D INSERT(T 5) ; HRE s AT. 

@ DELETE(T,s): HAE s AT 中 删除 。 

© ABOVE(T,s): 返回 工 中 直接 位 于 之 上 的 线段 。 

@ BELOW(T,s): 返回 中 直接 位 于 s 之 下 的 线段 。 

如 果 有 条 输入 线段 ,可 以 利用 平衡 树 ? 在 O(lgn) 时 间 内 执行 以 上 的 每 一 个 操作 。 可 
以 用 又 积 比 较 蔡 代 键 值 的 比较 来 判断 两 条 线段 的 相对 序 。 


3. 伪 代 码 描述 


下 列 的 算法 将 n 条 线段 集合 S 作为 输入 ,如 果 S 中 有 相交 线段 则 返回 布尔 值 TRUE, 
否则 返回 FALSE。 全 序 工 用 平衡 树 实现 。 


ANY-SEGMENTS-INTERSECT(S) 
1 T+ 
2 对 S 中 的 线段 的 端点 从 左 到 右 排序 
按 左 端点 先 于 右 端 点 的 方式 打破 僵局 
Uh y 坐标 优先 打破 横 坐 标 相等 的 僵局 
3 for 排 好 序 的 端点 列表 中 的 每 一 个 点 p 
4 do if p 是 一 线段 s 的 左 端点 


5 then INSERT(T,s) 

6 if CABOVECT S2 f£ fE H. 5j s 相交 ) 
or (BELOW(T,s) 存在 且 与 相交) 

7 then return TRUE 

8 ifp2-REs 的 右 端点 

9 then if ABOVE(T,s) 和 BELOW(T,s) 均 存在 
and ABOVE(T,s) 与 BELOW(T,s) 相 交 

10 then return TRUE 

11 DELETE(T,s) 


12 return FALSE 
算法 5-4 判断 线段 集合 中 是 否 有 线段 相交 的 算法 


图 5-7 示例 了 该 算法 的 执行 。 第 1 行 初 始 化 全 序 为 空 。 第 2 行 通过 对 2n 个 线段 端点 
从 左 到 右 的 排序 来 确定 事件 点 进度 表 , 当 端点 的 横 坐 标 相等 时 按 上 述 的 方法 打破 僵局 。 注 
意 第 2 行 可 以 对 (ze,y) 按 字典 方式 排序 ,其 中 zx 和 > 是 通常 的 坐标 ,而 e— 0 表 左 端点 ,e 一 
1 表 右 端点 。 

第 3 一 11 行 的 for 循环 每 一 次 重复 处 理 一 个 事件 点 p。 如 果 p 是 线段 ; 的 左 端点 ,第 5 
行 把 * 加 入 到 全 序 中 去 , 若 由 通过 p 的 扫描 线 定义 的 全 序 中 紧 挨 s 的 两 条 线段 中 有 一 条 与 
之 相交 ,第 6 行 和 第 7 行 返回 TRUE( 车 p 落 在 另 一 条 线段 :上 ,发 生 一 个 边界 条 件 。 此 时 ， 


O 平衡 树 指 的 是 左右 子 树 的 高 度 相差 渐进 常数 的 二 叉 搜索 树 ,其 中 的 元 素 按 中 序 排列 是 有 序 的 。 例 如 , 红 - 黑 树 就 
是 这 样 的 平衡 树 。 
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我 们 只 要 将 s 与; 相继 置 于 了 T 中) 。 如 果 p 是 线段 ; 的 右 端点 , 则 将 * 从 全 序 中 删除 。 若 由 
通过 的 扫描 线 定 义 的 全 序 中 紧 挨 * 的 两 条 线段 中 有 一 条 与 之 相交 ,第 9 行 和 第 10 行 返回 
TRUE。 这 两 条 线段 在 被 删除 后 而 在 T 中 相 邻 。 如 果 这 些 线段 不 相交 ,第 11 行将 从 工 
中 删除 。 最 后 , 若 处 理 完 了 2n 个 事件 点 后 ,没有 找到 交点 ,第 12 行 返回 FALSE。 

图 5-7 所 示 为 ANY-SEGMENTS-INTERSECT 的 执行 。 每 一 根 虚 线 为 事件 点 处 的 扫描 
线 , 每 条 扫描 线 下 是 for 循环 对 应 于 每 个 事件 点 处 理 的 末尾 的 全 序 工 中 的 线段 名 。 当 删除 
线段 < 时 ,找到 线段 4.b 相交 。 


一 时间 


(b) 
图 5-7 ANY-SEGMENTS-INTERSECT 的 执行 


4. 算法 的 正确 性 


用 定理 5-2 来 说 明 ANY-SEGMENTS-INTERSECT 过 程 的 正确 性 。 

定理 5-2 ”调用 ANY-SEGMENTS-INTERSECT(S) 返 回 TRUE 当 切 仅 当 S 中 有 线段 相交 。 

WEBB 过程 ANY-SEGMENTS-INTERSECT 不 正确 只 有 在 不 存在 相交 的 情况 下 返回 
TRUE 或 有 相交 线段 却 返 回 FALSE。 前 者 是 不 可 能 发 生 的 ,这 是 因为 ANY-SEGMENTS- 
INTERSECT 只 有 在 找到 两 条 线段 的 相交 时 才 返 回 TRUE。 

用 反 证 法 来 证 明 后 者 。 假 设 S 中 有 线段 相交 ,但 ANY-SEGMENTS-INTERSECT 返回 
FALSE。 设 户 是 最 左 端的 交点 , 且 线段 a Alb 相交 于 p。 由 于 在 p 的 左边 没有 交点 发 生 ， 
由 工 给 出 的 序 在 p 的 左边 都 是 恰当 的 。 因 为 没有 三 条 线段 共 点 ,存在 扫描 线 <, 使 得 线段 a 
和 2 在 全 序 中 是 紧 挨 着 的 。 此 外 ,= 在 的 左边 或 正 通 过 p。 存 在 某 条 线段 的 端点 g 在 扫描 
线 <, 即 g 是 一 个 事件 点 ,在 此 处 ,a 和 4 ESSE PEM BRA. Ap EA Ew 
b—q. E p REAR > EW qE p 的 左边 。 无论 哪 种 情形 ,由 工 给 出 的 全 序 在 g 处 理 
以 前 是 正确 的 。 在 事件 点 g 处 ,只 可 能 发 生 两 个 动作 之 一 。 


229 


从 算法 到 程序 (第 2 NO 


COD a hb 搬入 工 ,并 且 有 另 一 条 线段 在 其 上 或 其 下 。 第 4 一 7 行 能 测 得 它 。 

(2) 线段 a Mo BAET 中 ,并 且 它 们 之 间 的 线段 已 经 在 全 序 中 被 删除 ,使 得 a Alb 是 
紧 挨 着 的 。 第 8 一 11 行 测 得 此 情形 。 

无 论 哪 种 情形 ,交点 p 均 被 找到 ,此 与 过 程 返回 FALSE 的 假设 矛盾 。 

5. 运行 时 间 

车 集合 S 中 及 条 线段 , 则 ANY-SEGMENTS-INTERSECT 的 运行 时 间 为 O(nlgn)。 第 1 
行 耗 时 OCD ,第 2 行使 用 合并 排序 或 堆 排序 耗 时 O(nlgn)。 由 于 有 2n 个 事件 点 ,第 3 一 11 


行 的 for 循环 至 多 重复 2n 次 。 由 于 每 个 平衡 树 操作 耗 时 O(lgn) 并 且 是 用 第 5. 1 节 中 的 方 
法 ,每 个 交点 的 测试 耗 时 OCIO , 故 每 次 重复 耗 时 O(lgn)。 总 耗 时 为 O(nlgn)。 


5.2.2 程序 实现 


1. 线段 的 数据 表示 


线段 由 两 个 端点 确定 : 左 端点 和 右 端点 。 显 然 线段 端点 是 平面 上 的 点 ,这 只 要 在 Point 
类 的 基础 上 添加 一 个 表示 端点 类 别 ( 左 端点 / 右 端点 ) 的 属性 e 就 可 以 了 。 


1 typedef structí 

2 Point point; /* 端点 坐标 * / 

3 int e; / * 端点 标志 ( 左 端点 e 一 0, 右 端点 e 一 1)* / 
4 }EndPoint; / * 线段 端点 类 型 / 
5 int pointLess(EndPoint * a,EndPoint * b){ /* 端点 比较 / 

6 if(a-> point. x<b-> point. x) 

7 return 1; 

8 if(a-» point. x= — b-» point. x) 

9 if(a->e= =b->e) 

10 return a-> point. y<b-> point. y; 

11 else 

12 return a->e<b->e; 

13 return 0; 

14 } 

15 typedef struct{ 

16 EndPoint left; /* 左 端点 x*/ 

17 EndPoint right; [d x / 

18 double length; /* KEE * / 

19 double tan; /< 斜率 * / 

20 double yOffset; /* 所 在 直线 在 y 轴 的 截 距 * / 
21 J Segment; /* 线 段 类 * / 

22 Segment newSeg(Point * a,Point * b){ /* 生 成 线段 * / 


23 Segment c; 

24 c. left. point= * a; 
25 c. left. e=0; 

26 c. right. point— * b; 
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27 c. right. e—1; 

28 c. length dist( &c. left. point, &c. right. point) ; 

29 c. tan— ( (c. left. point). y— Cc. right. point). y)/((c. left. point). x— (c. right. point). x); 
30 c. yOffset— c. left. point. y— c. tan * Cc. left. point). xs 

31 return c; 

32) 


程序 5-4 ”线段 类 型 的 定义 


对 程序 5-4 的 说 明 如 下 。 

CD 第 1—4 行将 线段 的 端点 定义 为 结构 体 EndPoint。 其 中 point 成 员 是 程序 5-1 中 定 
义 的 平面 点 Point 类 型 ,记录 端点 的 坐标 。int 型 成 员 e 用 来 标识 端点 类 型 。 约 定 : 左 端点 
e 一 0, 右 端点 e—1. 

(2) 第 5 一 14 行 定 义 的 函数 pointLess 比较 由 参数 a、b 指引 的 两 个 端点 的 “大 小 *。 比 
较 的 规则 是 按 端 点 的 横 坐 标 、 类 型 和 纵 坐 标 构 成 的 三 元 组 (x,e,y) 的 字典 顺序 。 也 就 是 说 ， 
先 比较 两 个 点 的 横 坐 标 : 先 小 后 大 ; 若 遇 到 两 个 点 的 横 坐 标 相等 的 僵局 , 则 按 端点 类 型 先 左 
后 右 规 则 加 以 比较 ; 若 遇 上 两 个 点 同时 为 两 条 线段 的 左 端点 或 右 端点 的 僵局 , 则 按 纵 坐 标 先 
小 后 大 加 以 比较 。 

(3) 第 15 一 21 行将 线段 定义 为 结构 体 Segment。 第 22 一 32 行 定 义 的 函数 newSeg 用 
参数 a、b 指引 的 两 个 点 初始 化 一 条 线段 。 其 中 ,第 24 一 27 $ 


行将 线段 的 左 ` 右 端点 初始 化 为 ab。 第 28 行 调用 程序 5-1 Pd 
中 定义 的 函数 dist, 计 算 表 示 线 段 长 度 的 成 员 length, 58 Q^ ow) 


29 行 计算 表示 线段 所 在 直线 的 斜率 的 成 员 tan, 这 只 要 直接 
计算 两 个 端点 的 纵 坐 标 之 差 与 横 坐 标 之 差 的 商 就 行 了 。 第 QT 


30 行 计算 表示 线段 所 在 直线 在 y 轴 上 的 截 距 的 成 员 | 

yOffset。 由 于 已 经 知道 了 该 直线 的 斜率 tan 和 过 左 端点 l 
(zyy), 所 以 该 直线 方程 为 y 一 yi 二 tan(zx 一 x1)。 为 计算 图 5-8 RE ab 所 在 直线 在 
直线 在 y 轴 上 的 截 距 , 只 要 在 此 方程 中 令 z==0, 算 出 y 的 值 y 轴 上 的 截 距 


就 行 了 ,如 图 5-8 所 示 。 
2. 事件 点 进度 表 与 扫描 线 状态 表 


用 事件 扫描 的 方法 检测 线段 集合 S 中 是 否 有 线段 相交 ,需要 维护 两 个 集合 : 事件 点 进 
BER p 和 扫描 线 状态 表 T。 事 件 点 进度 表 ( 可 以 用 数组 来 表示 ) 中 作为 事件 点 的 线段 端点 需 
记录 它 所 在 的 线段 一 一 线段 在 数组 S 中 的 下 标 。 而 加 入 到 扫描 线 状 态 表 中 的 线段 要 组 织 
成 一 棵 平衡 树 , 用 2. 2.4 节 的 程序 2-16 至 程序 2-32 中 开发 的 红 - 黑 树 来 表示 。 由 于 要 对 事 
件 进度 表 进 行 排序 预 处 理 ,所 以 需要 利用 程序 5-4 中 定义 的 端点 比较 函数 pointLess 来 定义 
事件 点 的 比较 规则 。 而 要 将 线段 加 入 到 扫描 线 状 态 表 工 , 需 要 定义 线段 的 全 序 比 较 规则 。 


1 typedef struct{ /* 事件 点 类 型 */ 

2 EndPoint point; / * NR / 

3 int index; / * 端点 所 在 线段 在 数组 S 中 的 下 标 * / 
4 }pis 
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5 p_i newp_i(EndPoint p.int i) { /* 生 成 事件 点 表 中 的 元 素 * / 

6 pix 

7 x. point —p; 

8 x. index=i; 

9 return x; 

10j 

11 int p iComp(p i *a.p i * b){ /* 按 端点 的 比较 规则 比较 事件 点 * / 
12 return pointLess(& Ca->point) , &-(b-> point) ) ; 

13 } 

14 double getY(Segment * a,double x) { / * 计算 线段 在 x 处 的 纵 坐 标 * / 
15 assert(x>=a->left. point. x&&x 一 一 a->right. point. x); 

16 return a->tan * x 十 a->yOffset; 

17 } 


18 int segComp(Segment * a,Segment * b){ /* 线段 比较 x*/ 
19 double x0=a->left. point. x>b-> left. point. x?a—>left. point. x:b->left. point. x, 


20 xl=a->right. point. x<b-> right. point. x?a—> right. point. x: b-> right. point. xy 
21 x= (x0+x1)/2. 0; 

22 return getY (a,x) >getY (b,x); 

23 } 


程序 5-5 事件 点 类 型 定义 及 线段 比较 规则 

对 程序 5-5 的 说 明 如 下 。 

CD 第 1 一 4 行将 本 问题 的 事件 点 定义 为 结构 体 p_i。 它 是 在 EndPoint 类 型 的 基础 上 
添加 一 个 表示 端点 所 在 线段 在 数组 S 中 的 下 标的 成 员 index。 第 5 一 10 行 定 义 的 函数 
new p_i 用 参数 端点 p 及 参数 i 初始 化 新 建 的 事件 点 。 

(2) 第 11 一 13 行 定义 的 函数 p_iComp 对 由 参数 a、b 指引 的 事件 点 对 应 的 端点 ,调用 程 
序 5-4 中 定义 的 函数 pointLess 比较 它们 的 “大 小 ”。 该 函数 用 来 对 事件 点 进度 表 进 行 排序 
操作 。 

(3) 第 18 一 23 行 定义 的 函数 segComp 按 正文 中 讨论 的 规则 比较 由 参数 a、b 指引 的 两 
条 线段 的 关系 。 第 19 行 和 第 20 行 分 别 计算 x1— max(a 的 左 端点 ,b 的 左 端点 ) ,x2 一 min(a 
的 右 端 点 ,b 的 右 端 点 ) ,第 21 行 计 算 x1. x2 的 平均 值 为 x。 第 22 行 调用 函数 get Y ,比较 线 
段 a 和 b 在 x0 处 的 纵 坐标 ,并 借以 比较 两 者 的 上 、 下 关系 。 函 数 getY 定义 于 第 14 一 17 行 ， 
该 函数 计算 由 参数 a 指引 的 线段 在 参数 x 处 的 纵 坐 标 。 对 a 所 在 的 直线 ,已 知 斜 率 为 tansy 
轴 上 的 截 距 为 yOffset, 则 在 x 处 的 纵 坐 标 为 a->tan * x 十 a->yOffset。 


3. 判断 线段 集合 S 中 是 否 有 相交 线段 


有 了 程序 5-4 和 程序 5-5 的 准备 ,下 面 来 实现 算法 5-4 的 ANY-SEGMENTS-INTERSECT 
过 程 ,检测 线段 集合 S 中 是 否 有 线段 相交 。 


1 int anySegmentIntersect( Segment * S,int n){ 


2 int i; 
3 RBTree * T=creatRBTree (sizeof( Segment) ,segComp); /* 扫描 线 状态 表 */ 
4 pi * p—(p i * )malloc(2 * n * sizeof(p_i)); /* 事 件 点 进度 表 数 组 / 
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for(i=0si<nsit+){ / * 填写 事件 进度 表 * / 


pL2*i]=newp_i(getLeft(&S[i]),D); 
p[2*it+1]=newp_i(getRight(&S[i]),D; 


quickSort(p,sizeof(p_i) ,0,n 一 1,p_iComp);，  /* 对 事件 进度 表 排序 * / 


for(i=0;i<2 * nii 十 十 ){ /* 对 事件 点 进度 表 扫 描 */ 
Segment * s= &-S[p[i]. index], * above, * below; 
RBNode * pt; 
Point pl,p2,p3,p4; 
ifCp[i]. point. e 一 一 0){ /* 如 果 该 端点 为 某 线段 的 左 端点 * / 
pl=getLeft(s). point; p2— getRight(s). point; 
pt— rbInsertC T.) ; / * RE s HA To pt 指向 该 线段 * / 


above= (Segment * ) (treePredecessor( pt) ) -» key; 
below= (Segment * ) (treeSuccessor( pt) ) ^ key; 
if(above! = NULL) { / * above 是 紧 挨 着 s 且 处 于 上 方 的 线段 / 
p3=getLeft(above). point; p4=getRight(above). point; 
if(segmentsIntersect( &-p1 , &p2,&-p3,&-p4)) / * above,s 相交 */ 
break; 
} 
if(below! = NULL) / * below 是 紧 挨 着 s 且 处 于 下 方 的 线段 / 
p3=getLeft(below). point; p4 — getRight(below?. point; 
if(segmentsIntersect( &-p1 , &p2, 8. p3, &- p4)) / * sbelow 相交 */ 
break; 
) 
Jelse{ /* 若 该 端点 是 某 线段 的 右 端 点 * / 
pt=rbSearch(T,s); /* pt 指向 线段 sx / 
above= (Segment * ) (treePredecessor(pt) ) ->key; 
below (Segment * ) (treeSuccessor( pD) -» key; 
if(above! = NULL8&-8-below! = NULL) ( 
pl=getLeft(above). point; p2— getRightC above). point; 
p3=getLeft( below). point; p4— getRight( below). point; 
if(segmentsIntersect( & pl, &-p2, &-p3 , &-p4)) / * above, below 相交 * / 


break; 
) 
rbDeleteC T pt); /< 从 工 中 删除 该 线段 * / 
) 
free(p) ; 
clrRBTreeC T, NULL) ;free(T) ; 
ifG<2 * n) /* 有 线段 相交 * / 
return 1; 
return 0; /* 没 有 相交 线段 */ 


程序 5-6 ”实现 算法 5-4 中 ANY-SEGMENTS-INTERSECT 过 程 的 C 函数 
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对 程序 5-6 的 说 明 如 下 。 

(1) 函数 anySegmentIntersect 有 两 个 参数 ,表示 线段 集合 的 数组 S 和 S 中 所 含 线段 数 
n。 若 S 中 有 线段 相交 ,该 函数 返回 1 ,否则 返回 0。 

(2) 第 3 行 定 义 了 红 - 黑 树 RBTree 型 指针 工 ,并 为 其 生成 一 棵 空 树 ,决定 树 中 结 点 前 后 
关系 的 规则 为 程序 5-5 中 定义 的 函数 segComp。 第 4 行为 指向 事件 点 进度 表 的 p_i 型 指针 
p 分配 能 存储 2n 个 元 素 的 数组 空间 ,第 5 一 8 行将 S 中 nn 条 线段 的 左右 端点 填写 到 p 指向 
的 数组 中 。 第 9 行 调用 3. 2. 2 节 程 序 3-8 开发 的 快速 排序 函数 quickSort, 按 程序 5-5 中 定 
义 的 比较 线段 端点 构成 的 事件 点 先后 关系 的 函数 p_iComp 对 数组 p 排序 ,从 而 确定 事件 点 

G) 第 10 一 41 行 的 for 循环 实现 算法 中 第 3 一 11 行 的 for 循环。 程序 代码 与 算法 伪 代 
码 的 结构 十 分 接近 。 需 要 说 明 的 是 ,对 计算 扫描 状态 表 T 中 与 线段 y 紧 挨 着 且 处 于 上 方 线 
段 的 ABOVE 过 程 ,由 于 使 用 第 2 章 中 开发 的 红 - 黑 树 表示 工 ,这 相当 于 调用 treePredecessor 
函数 在 工 中 计算 s 的 前 驱 。 类 似 地 ,调用 treeSuccessor 函数 ,计算 工 中 s 的 后 继 来 实现 算 
法 中 的 BELOW 过 程 的 调用 , 且 从 方便 起 见 , 将 这 两 个 函数 调用 的 返回 值 赋予 变量 above 和 
below( 见 第 17、18、31、32 行 )。 在 检测 above 与 s, below 与 s\above 与 below 是 否 相 交 时 , 调 
用 程序 5-2 中 定义 的 函数 segmentsIntersect( 见 第 21 行 和 第 36 行 )。 此 外 ,为 防止 内 存 泄漏 , 函 
数 返回 前 第 42 和 第 43 行 负责 释放 指针 p 指向 的 动态 存储 空间 和 红 - 黑 树 的 存储 空间 。 

程序 5-4 至 程序 5-6 中 定义 的 数据 类 型 和 函数 的 原型 声明 存储 于 文件 夹 geometry 中 的 
头 文件 segment. h 中 ,各 函数 的 定义 存储 于 同一 文件 夹 中 的 源 文件 segment. c P. 


5.3 koe 


点 的 集合 Q 的 凸 壳 是 一 个 西 多 边 形 P.Q 中 的 每 个 点 要 么 在 P 的 边界 上 ,要 么 在 P 的 
内 部 。 我 们 用 CH(Q@) 表 示 QWs. FOU dE Q 中 的 点 看 成 钉 在 板 上 的 钉子 。Q 的 凸 
壳 看 成 是 用 橡 筋 夭 在 这 些 钉子 上 围 成 的 形状 。 Pio 
图 5-9 展示 了 一 个 点 的 集合 及 其 凸 壳 。 

在 本 节 中 ,将 介绍 两 个 算法 来 计算 n 个 点 的 集 
合 的 凸 充 。 这 两 个 算法 都 按 道 时 针 方向 输出 凸 壳 
的 顶点 。 第 一 个 算法 称 为 Graham 扫描 ,运行 时 间 
为 O(nlgn) ;第 二 个 算法 称 为 Jarvis 行进 ,运行 时 间 
为 Oltnh), 其 中 及 为 凸 壳 的 项 点数。 如 图 5-8 所 
示 ,CH(Q) 的 每 一 个 顶点 都 是 Q 的 点 。 两 个 算法 


i 图 5-9 ARA QS {popis spi) 
都 使 用 这 一 特性 ,决定 Q 中 的 哪些 顶点 作为 凸 壳 的 RERE KNE CHQ) 


顶点 加 以 保留 ,而 舍弃 哪些 顶点 。 

计算 点 集 的 凸 沉 本 身 是 一 个 很 有 趣 的 问题 。 此 外 ,一 些 其 他 的 计算 几何 问题 以 计算 凸 
党 为 开始 。 例 如 ,考虑 二 维 的 最 远 点 对 问题 : 平面 上 给 定 nn 个 点 ,希望 找到 其 中 相距 最 远 的 
两 个 点 。 这 两 个 点 必 是 凸 壳 边界 上 的 顶点 ,尽管 我 们 在 此 并 不 证 明 。 事 实 上 ,nn 个 顶点 的 凸 
壳 的 最 远 点 对 可 以 在 O(n) 时 间 内 求 得 。 于 是 ,通过 在 时 间 O(nlgn) 内 计算 出 个 输入 点 的 
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凸 壳 ,然后 求 得 所 得 的 凸 壳 的 最 远 点 对 ,可 以 在 时 间 O(nlgn) 内 找到 1 个 点 的 集合 的 最 远 


5.3.1 Graham 扫描 


1. 算法 描述 


Graham 扫描 法 通过 维护 一 个 候选 点 的 栈 S 来 解决 凸 过 问题 。 输 入 集合 Q 的 每 一 个 点 
被 讨 人 栈 一 次 ,并 且 不 是 CH(Q) 顶 点 的 点 最 终 将 被 弹出 栈 S。 在 算法 终结 时 , 栈 S 恰好 包 
TET CHCQ) 的 顶点 ,并 以 它们 在 边界 上 出 现 的 逆 时 针 顺 序 排列 。 

过 程 GRAHAM-SCAN 将 点 集 Q@ 作 为 输入 ,其 中 |Q| 三 3。 它 调用 函数 ToP(S) ,该 函数 
返回 处 于 栈 S 的 栈 顶 的 点 而 不 改变 S。 调 用 函数 NEXT-TO-TOP(S) , 它 返回 栈 顶 下 的 点 而 
不 改变 栈 S。 下 面 就 要 证 明 由 GRAHAM-SCAN 返回 的 栈 S 从 栈 底 到 栈 顶 恰好 是 CH(Q) 的 
顶点 按 逆 时 针 的 排列 。 


GRAHAM-SCAN(Q) 
1 设 加 是 Q 中 最 小 纵 坐 标的 点 ,多 个 这 样 的 点 取 最 左边 的 点 
2 <p sprs s pm >A QM FMR SHEA po 的 极 角 逆 时 针 顺 序 排列 
(车 有 多 个 极 角 相 同 的 点 , 留 取 其 中 距 po 最 远 的 点 而 删除 其 余 点 ) 
PUSH( po +S) 
PUSH( p, +S) 
PUSH(p: +S) 
for i — 3 tom 
do while 由 点 NEXT-TO-TOPCS) , TOPCS) All p, 构成 的 角 非 左 转 
do POP(S) 
PUsH(pi,S) 


€ 0 -3 Oo oc w 


10 return S 
算法 S-5 iAP MARTH ETE IEEE GRAHAM-SCAN 


图 5-10 示例 了 GRAHAM-SCAN 的 执行 。 第 1 行 把 具有 最 小 纵 坐 标的 点 选 为 pos HE 
个 具有 如 此 相同 纵 坐 标的 点 , 取 横 坐标 最 小 的 。 由 于 在 Q 中 不 存在 po 以 下 的 点 , 且 具 有 相 
同 纵 坐标 的 点 都 处 于 po 的 右边 ,所 以 po 是 CH(CQ) 的 顶点 。 第 2 行 利用 算法 5-3 中 伪 极 角 
的 方法 把 Q 中 其 余 的 点 按 关 于 po 的 极 角 排 序 。 如 果 两 个 或 多 个 点 具有 相同 的 关于 po 的 
极 角 , 则 除了 最 远 的 那 一 个 以 外 ,所 有 的 都 是 po 与 那个 最 远 点 的 凸 组 合 , 因 此 将 它们 都 一 并 
BA. Hm 表示 剩余 的 不 同 于 po 的 点 的 数目 。 极 角 用 弧度 度量 ,Q 中 的 每 一 个 点 关于 po 
的 极 角 在 半 闭 半 开 区 间 [o,x) 内 。 由 于 极 角 的 增加 的 方向 是 逆 时 针 的 ,所 以 存储 的 点 也 是 
关于 po 逆 时 针 顺序 的 。 用 二 pi , 思 ,…: 加 二 表示 这 一 排 好 序 的 序列 ,它们 是 CH(Q) 的 顶 
点 。 图 5-10(a) 展 示 了 图 5-9 的 那些 点 ,并 按 关于 po 的 极 角 递增 顺序 编号 。 

图 5-10 所 示 为 对 图 5-9 中 的 集合 Q 执行 GRAHAM-SCAN。 包 含 在 栈 S 的 当前 凸 壳 在 
每 一 步 中 用 灰色 连 线 显示 。 图 5-10 G0 P< pis perm bus > BRKT po 的 极 角 排列 的 点 
的 序列 。 栈 的 初始 状态 含有 popi 和 户 。 图 5-10(b) 一 图 5-10(k) 对 应 第 6 一 9 行 的 for 循 
环 的 每 一 次 重复 后 的 栈 S。 虚 线 表示 的 是 非 左 转 的 点 , 而 被 弹出 栈 S。 例 如 在 图 5-10(Ch) 
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FA 5-10 对 图 5-9 中 的 集合 Q 执行 GRAHAM-SCAN 
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图 5-10 (4D 


BATHE IZ br Ds ps. TE ps 被 弹出 ,然后 右 转角 一 zzjj 导致 p; 被 弹出 。 由 过 程 GRAHAM- 
SCAN 返回 的 凸 壳 与 图 5-9 相符 。 

过 程 其 余部 分 使 用 栈 S。 第 3 一 6 行 初 始 化 栈 , 令 其 从 栈 底 到 栈 顶 包含 po。、p， 和 pos 
图 5-10(a) 展 示 了 初始 的 栈 S. 55 6 一 9 行 的 for 循环 对 序列 二 p;,p;，… ,pa 二 中 的 每 一 个 
点 重复 一 次 。 目 的 是 使 在 处 理 完 点 p. 后 栈 S. 中 从 底 到 项 按 逆 时 针 方 向 的 顺序 包含 了 
CHC posit DRITA. H 7~8 13109 while 循环 把 发 现 的 不 是 凸 壳 顶 点 的 点 从 栈 中 
去 掉 。 当 我 们 按 逆 时 针 方向 遍历 凸 壳 顶 点 的 时 候 ,在 每 个 顶点 处 总 是 左 转弯 。 因 此 ,在 此 
while 循环 中 每 次 遇 到 非 左 转弯 的 顶点 就 把 它 从 栈 中 弹出 (检测 非 左 转 而 不 是 右 转 ,排除 了 
凸 党 上 的 平角 可 能 性 。 这 是 我 们 所 希望 的 ,因为 凸 壳 的 任 一 顶点 都 不 应 是 该 多 边 形 另外 两 
顶点 的 凸 组 合 )。 在 弹出 所 有 以 p; 为 首 的 非 左 转 顶 点 后 ,将 p; 压 栈 。 图 5-10(b) 一 图 5-10(k) 
展示 了 for 循环 的 每 一 次 重复 后 栈 S 的 状态 。 最 后 ,GRAHAM-SCAN 在 第 11 行 返回 栈 S, 
图 5-10(D) 展 示 了 逆 时 针 的 凸 壳 。 


2. 算法 正确 性 


下 列 定理 形式 地 证 明了 GRAHAM-SCAN 的 正确 性 。 

定理 5-3(Graham 扫描 的 正确 性 ) 如 果 GRAHAM-SCAN 运行 于 点 集 Q, 其 中 |Ql 三 3， 
W Q 中 的 点 在 终结 时 在 栈 S 中 从 底 至 顶 恰 含 有 CH(Q) 的 按 逆 时 针 方 向 的 各 顶点 。 

证 明 第 2 行 后 ,有 点 的 序列 过 py ,ps，… ,pm 记 。 对 i 二 2,3,…,m, 定 义 点 的 子 集 合 
Q= {popi pi)。 在 Q 一 Q。, 中 的 点 是 那些 因为 与 Q， 中 的 点 具有 相同 的 关于 po 的 极 角 
而 被 删除 的 点 : 这些 点 不 在 CH(Q) 中 ,所 以 CH (Qa) 二 CH(Q)。 于 是 ,只 要 说 明 在 
GRAHAM-SCAN 终止 时 , 栈 S 从 底 到 顶 由 CH CQ, ) 的 各 顶点 按 逆 时 针 方向 组 成 。 注 意 如 同 
Do bi 和 pn 是 CH(Q) 的 顶点 ,po、p1 和 pp; 是 CH(Q;) 的 顶点 。 

证 明 用 到 如 下 循环 不 变量 。 

在 第 6 一 9 行 的 for 循环 的 每 一 次 重复 开始 时 , 栈 S 从 底 到 顶 由 CH (Qi-1) 的 顶点 按 逆 
时 针 方 向 组 成 。 

对 Q 中 的 顶点 数 i 作 归纳 。 首 次 执行 第 6 行 时 ;一 3, 不 变量 是 成 立 的 。 这 是 因为 此 时 
栈 S 恰 由 Q; 二 Qi_1 的 顶点 组 成 , 且 此 集合 的 3 个 顶点 自身 构成 一 个 凸 壳 。 此 外 ,它们 按 出 
现 的 道 时 针 方 向 自 底 向 顶 存 于 S 中 。 设 3 二 ;一 时 循环 不 变量 是 正确 的 。 进 入 for 循环 的 
此 次 重复 ,S 的 栈 顶 点 是 ~: , 它 是 在 上 一 次 重复 结束 时 压 入 栈 的 ( 当 i= 3 时 ,是 在 第 一 次 
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重复 前 )。 设 p, 是 执行 了 第 7 行 和 第 8 行 的 while 循环 后 而 在 第 9 TRA p, 之 前 S 的 栈 顶 
的 点 , 且 p, JE S PHATE pi 之 下 的 点 。 在 p; AREA. pi WS 的 栈 顶 点 之 时 , 栈 S 恰 包 含 
T for 循环 的 第 j 次 重复 以 后 S 中 所 包含 的 点 。 按 循环 不 变量 ,此 时 S 恰 包 含 CH(Q ) 的 顶 
点 ,并 从 底 至 顶 按 逆 时 针 方向 顺序 出 现 。 

我 们 继续 关注 p. 压 栈 前 的 时 刻 。 参 考 图 5-10(a) ,由 于 p; 关于 po 的 极 角 大 于 p; WR 
fi. ASN L pep jp: 左 转 ( 否 则 的 话 将 弹出 po ,我 们 看 到 由 于 S 恰 包 含 了 CH(Q ) 的 顶点 ,一 
旦 将 p; 压 栈 ,S 中 将 恰 包 含 CH CQ; U {pi)) 的 顶点 , 且 依 然 是 从 底 至 顶 按 道 时 针 方 向 的 
顺序 。 

现在 来 说 明 CHQ; U1{pi)) 和 CH(Q;) 是 相同 的 点 集 。 考 虑 for 循环 的 第 i 次 重复 中 任 
意 一 个 被 弹出 的 点 p,, 并 设 p. 是 p, 被 弹出 时 栈 S 中 恰 处 于 p, 下 面 的 点 (p, 可 能 就 是 p) o 
角 达 prpip; 构成 非 左 转角 ,p, 关于 po 的 极 角 大 于 p, 的 极 角 。 如 图 5-10(b) 所 示 , 或 在 由 
bo «b. 和 pi; 构成 的 角 的 内 部 ,或 在 该 角 的 边 上 (但 不 是 该 角 的 顶点 )。 显 然 , 由 于 p, 在 Qi; 的 
另外 3 个 点 构成 的 角 的 内 部 , 它 不 可 能 是 CH(Q;) 的 一 个 顶点 ,我 们 有 

CH(Q, — (5,D = CH(QQ). (5-1) 

设 P, 是 for 循环 的 第 i 次 重复 期 间 弹 出 点 构成 的 集合 。 由 于 式 (5-1) 可 用 于 P; 中 的 所 
有 点 ,可 以 重复 使 用 它 说 明 CHQ — P) =CH(Q,). 但 是 Q — P; =Q U (p) ,因此 推出 
CH(Q; U (5; D =CH(Q,— P) =CH(Q;). 

我 们 已 经 说 明了 一 旦 把 p; 压 栈 ,S 中 自 底 向 项 恰 以 逆 时 针 顺 序 包含 CH(Q;) 的 各 顶点 。 
随 着 i 的 增长 ,在 下 一 次 重复 中 循环 不 变量 也 成 立 。 

当 循环 结束 时 ,有 i 二 =m 十 1, 所 以 循环 不 变量 实现 了 在 栈 S 中 恰 包 含 CHC) ,也 就 是 
CH(Q) 的 各 顶点 ,它们 是 以 道 时 针 顺 序 自 底 向 顶 置 于 栈 S 中 。 这 就 完成 了 证 明 。 

图 5-11 所 示 为 GRAHAM-SCAN 正确 性 证 明 。 图 5-11(a) 中 ,由 于 p; 关于 po 的 极 角 大 
T b; (IN. FLfü ZZ pe sb: 左 转 , 将 p; 添加 到 CH(Q;) 中 将 恰 得 到 CH(QjU {pi)) 的 顶点 。 
图 5-11(b) 中 ,车 角 和 pp,p; 非 左 转 , 则 p, 或 在 由 po、p, 和 pp; 构成 的 角 的 内 部 ,或 在 该 角 的 
边 上 ,总 之 不 可 能 是 CH(Q;) 的 顶点 。 


Pj Pi Pj 


Pi n 
Po Po 
(a) (b) 


图 5-11 GRAHAM-SCAN 正确 性 证 明 


3. 算法 分 析 


现在 来 说 明 GRAHAM-SCAN 的 运行 时 间 是 O(nlgn) ,其 中 ==1Q|。 第 1 行 耗 时 OC). 
第 2 行 利用 归并 排序 或 堆 排序 及 动手 做 算法 5-5 的 叉 积 方法 对 极 角 排序 耗 时 O(nlgn)。 第 
3 一 6 行 耗 时 O(1) 。 因 为 ms 入 zx 一 1, 第 7 一 10 行 的 for 循环 至 多 重复 n—3 次 。 由 于 PUSH 
操作 耗 时 OO) ,该 循环 的 每 次 重复 除了 第 8 一 9 行 的 while 循环 , 耗 时 O(1)。 因 此 ,该 for 
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循环 除了 内 艇 的 while 循环 外 将 耗 时 OG) 。 

下 面 来 说 明 while 循环 全 部 耗 时 O(z) 。 对 i 二 0,1,…,m, 每 一 个 点 p; 仅 人 栈 一 次 。 对 
每 一 次 PUSH 都 至 多 有 一 次 POP 操作 。 至 少 有 po、p 和 加 始终 不 出 栈 , 故 总 共 至 多 有 
m—2 个 POP 操作 的 执行 。while 循环 的 每 一 次 重复 执行 一 个 POP 操作 ,因此 ,该 while (ff 
环 总 共 至 多 重复 m—2 次 。 因 为 第 8 行 的 测试 耗 时 OCD ,每 次 调用 Pop 耗 时 OCD ,并 且 
m<n—1, Jk while 循环 总 耗 时 O(n)。 于 是 ,GRAHAM-SCAN 的 运行 时 间 为 O(nlgn)。 


5.3.2 程序 实现 


1. 计算 点 集中 的 最 低 点 

算法 5-3 的 第 一 步 是 在 平面 点 集 Q 中 计算 纵 坐 标 最 小 的 点 作为 计算 其 他 各 点 的 极 角 
的 基准 点 pe。 计算 一 个 全 序 集 ( 很 多 情形 下 是 存放 于 数组 中 ) 的 最 大 (小 ) 元 素 是 很 多 算法 
中 的 基本 操作 ,下 列 程序 是 一 个 能 对 各 种 类 型 的 数组 计算 最 大 (小 ) 元 素 的 函数 。 


1 int most(void * a,int n,int size,int( * comp) (void * ,void * )){ 

2 void * m= malloc(size) ; 

3 int i. k—0; 

4 memepy(m,a, size) ;/ * m < a[0] * / 

5 for(i=1;i<n;i 十 十 ) 

6 if(comp(((char* )a 十 ix size),m)>0){ / * a[i] 55 m WR x / 
7 memcepy(m, ( (char * )a+i * size) , size) ; /*m- a[i]*/ 
8 k=i; 

9 ) 

10 free(m) ; 

11 return k; 

12 } 


程序 5-7 计算 组 成 数组 的 全 序 集中 的 最 大 (小 ) 元 素 的 函数 


对 程序 5-7 的 说 明 如 下 。 

CD. 函数 most 计算 具有 n 个 元 素 ( 元 素 的 存储 宽度 为 size) 的 数组 a 中 , 按 大 小 比较 规 
Jl] comp 计算 最 大 (小 ) 元 素 的 下 标 并 作为 函数 值 返回 。 为 了 能 表示 各 种 不 同类 型 的 数组 ， 
参数 a 的 类 型 为 void * 。 为 适应 各 种 全 序 关系 ,元 素 大 小 比较 规则 通过 传递 给 它 的 函数 指 
针 参 数 comp 确定 。 

(2) 函数 中 ,用 指针 m 指引 的 动态 存储 空间 跟踪 数组 a 中 的 最 大 (小 ) 值 ,用 跟踪 最 大 
(小 ) 值 的 下 标 , 变 量 i 用 来 控制 for 循环 并 表示 扫描 数组 时 元 素 的 下 标 。 

G) 第 4 行 调用 库 函 数 memcpy 将 aL0j 的 值 赋 于 m 指向 的 内 存 空间 (第 2 行 分 配给 m 
的 )。 该 函数 的 使 用 说 明 请 参见 本 书 2. 1. 3 节 的 相关 内 容 。 第 5 一 9 行 的 for 循环 扫描 数组 
a ali EX CTO F m. W m IRER a[i].k 跟踪 i。 需 要 注意 的 是 由 于 a 中 元 素 的 存储 宽度 为 
i 所 以 a 十 ix size 指向 ali]. HARM LK 表示 最 大 (小 ) 元 素 的 下 标 , 第 11 行将 其 返回 。 
在 此 之 前 ,第 10 行 释放 m 指向 的 内 存 空间 ,以 防 泄漏 。 

函数 most 是 计算 表示 全 序 集 的 数组 的 最 大 (小 ) 元 素 下 标的 通用 函数 。 为 便于 代码 重 
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用 ,将 其 原型 声明 保存 为 文件 夹 datastructure 中 的 头 文件 most. h, FEF 5-7 则 保存 为 同一 
文件 夹 内 的 源 文 件 most. c。 


要 为 参数 comp 定义 一 个 函数 。 


1 static int pyxcomp(Point * a,Point * b){ 

if(a—>y<b->y) 
return 1; 

if(a-»y— —b-»y8-&a-» x<b->x) 
return 1; 

if(a-»y— —b-»y8-&a-»x— —b-»x) 
return 0; 

return—1; 


€ 0 - Oo Oc & o t 


程序 5-8 平面 点 纵 坐标 的 比较 


函数 pyxcomp 对 参数 a,b 指引 的 平面 点 首先 比较 两 者 的 纵 坐标 ,小 则 优先 (第 2 行 和 
第 3 行 ) 返 回 1。 若 纵 坐 标 相 等 则 比较 横 坐 标 , 小 则 优先 (第 4 行 和 第 5 行 ) 返 回 1; 若 两 点 相 
同 , 则 返回 0; 其余 情况 返回 一 1。 

车 n 个 点 构成 的 点 集 存放 于 数组 p, 调 用 函数 most(p,n,sizeof(Point) ,pyxcom) 将 返回 
p 中 最 低 点 ( 纵 坐 标 最 小 者 ) 的 下 标 。 


2. 平面 点 按 极 角 排 序 


在 本 扫描 线 算法 中 ,事件 点 进度 表 是 按 点 集中 各 点 关于 用 上 述 的 most 函数 找到 的 纵 
坐标 最 小 的 点 po 的 极 角 升 序 排列 的 有 序 线性 表 。 可 以 调用 第 3 章 中 开发 的 quikSort 函数 


对 数组 p 按 各 点 关于 po 的 极 角 升序 排序 。 这 需要 定义 平面 点 a、b 关 于 po 的 极 角 大 小 比较 
的 函数 。 

1 static Point * O; 

2 static int angleComp(Point * a,Point * b)( / * 比较 点 a.b 关于 点 O 的 极 角 大 小 * / 


3 double anglea— psudoPolarAngle(a,O) ,angleb= psudoPolarAngle(b.O) ; 
if(anglea= = angleb) 

return 0; 
if(anglea<angleb) 

return—1; 


return 1; 


€ 0 3 0 0 & 


BF 5-9 按 极 角 比 较 两 点 大 小 的 函数 
第 2 一 9 行 定义 的 函数 angleComp 比较 指针 参数 ab 指向 的 点 关于 点 O 的 极 角 的 大 
小 。 若 a 关 于 O 的 极 角 大 于 b 关 于 O 的 极 角 ,函数 返回 1; 若 前 者 小 于 后 者 ,函数 返回 一 1; 
车 两 者 相等 ,函数 返回 0。 注 意 ,第 3 行 调用 程序 5-3 中 定义 的 计算 向 量 伪 极 角 的 函数 
psudoPolarAngle, 分 别 计算 a 关于 O ff fü Al b 关于 O 的 极 角 。 由 于 该 函数 作为 quikSort 
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的 参数 对 事件 点 进度 表 p 排序 , 它 应 为 函数 类 型 (int * ) (void * ,void * ) ,所 以 相关 点 Op 
中 纵 坐 标 最 小 的 点 ) 不 能 作为 函数 的 参数 ,因此 在 第 1 行将 其 定义 为 全 局 变量 。 


3. 计算 平面 点 集 的 凸 壳 
利用 程序 5-7 至 程序 5-9 中 定义 的 函数 ,可 实现 算法 5-3。 


1 
2 
3 
4 
5 
6 
7 
8 
9 


Point * grahamScan(Point * p,int n,int * m){ 


Point *q; 
Stack * S= createStack(sizeof( Point) ) ; 
int i— most( p. n,sizeof( Point) , pyxcomp) ; 
swap(p; pc i,sizeof( Point) ) ; 
O=p; 
quickSort(p+ 1, sizeof(Point) ,0,n—1,angleComp) ; 
push(S, p);push(S,p+1);push(S,p+2); 
for(i=3;i<n;it++){ 
ListNode * b=S->top, * a=b->next; 
while(direction(a-» key b-» key p-- 770) ( 
pop(S); 
b=S->top; 
a=b->next; 
) 
push(S,p+i); 
) 
* m=S->L->n;q= (Point * )calloc( * m,sizeof(Point)) ; 
for(i— * m—1;i—0;i— —)( 
ListNode * x= pop( S) ; 
q[i]— * «(Point * )(x->key)); 
clrListNode( x. NULL) ; 
free(x) ; 
) 
clrStack(S, NULL); 
free(S) ; 
return q; 


程序 5-10 ”实现 算法 5-3 GRAHAM-SCAN 过 程 的 C 函数 


对 程序 5-10 的 说 明 如 下 。 

CD. 用 平面 点 Point 型 数组 p 表示 平面 点 集 Q, 并 为 参数 。 参 数 n 表示 Q 中 点 的 个 数 。 
与 算法 5-3 稍 有 不 同 的 是 ,为 便于 运用 ,函数 grahamScan 并 不 是 直接 返回 存放 凸 包 的 栈 , 而 
是 将 栈 中 的 点 转 存 为 一 个 数组 ,然后 返回 该 数组 。 由 于 C 语言 的 数组 不 含 元 素 的 个 数 属 
性 ,所 以 用 指针 参数 m 来 指引 所 返回 数组 的 元 素 个 数 。 

(2) 第 3 行 用 第 2 章程 序 2-12 定义 的 类 型 Stack 声明 栈 S。 第 4 行 调用 程序 5-7 中 的 
函数 most 计算 列表 p 中 纵 坐 标 最 小 者 的 下 标 ij。 注意 ,调用 most 时 传递 给 它 的 第 4 个 参数 
是 指向 程序 5-8 定义 的 函数 pyxcomp 的 指针 。 第 5 行 调用 第 3 章程 序 3-3 定义 的 函数 
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swap, 交 换 数组 p 中 的 pL0]、p[ 记 使 得 pL0] 为 p 中 的 纵 坐 标 最 小 者 。 第 6 行使 全 局 变量 O 
指向 pL0]。 第 7 行 调用 第 3 章程 序 3-10 定义 的 函数 quikSort, 对 p[1..n 一 1] 按 各 点 关于 O 
的 极 角 升序 排序 。 该 函数 的 原型 是 


void quickSort(void * a,int size,long p,long r.int( * comp)(void * ,void * )); 


其 中 ,参数 a 表示 需 排序 的 数组 ,参数 size 表示 数组 元 素 的 存储 宽度 ,参数 pr 表示 子 数 组 
的 起 点 和 终点 下 标 , 而 第 5 个 参数 comp 表示 存储 于 a 中 的 全 序 集 的 元 素 大 小 比较 规则 。 

注意 传递 给 quikSort 的 第 5 个 参数 是 程序 5-9 中 定义 的 函数 angleComp 的 指针 。 这 样 
就 完成 了 算法 第 1 行 和 第 2 行 的 操作 。 

G) 第 8 行 ,将 pL0]、p[1] 和 p[2] 一 次 压 入 栈 S, 实 现 算法 中 的 第 3 一 5 行 操作 。 第 9 一 
17 行 的 for 循环 对 应 算法 中 第 6 一 9 行 的 for 循环 。 其 中 的 a 对 应 NEXT-TO-TOP(S),b 对 
应 TOP(S) ,第 11 一 15 行 的 while 循环 完成 算法 中 第 7 行 和 第 8 行 的 while 循环 。 第 12 17 
和 第 16 行 调用 第 2 章程 序 2-13 中 定义 的 函数 pop 和 push 完成 对 S 的 弹出 和 压 栈 操作 。 
第 18 行为 存放 要 返回 的 凸 包 的 数组 q 分 配 空间 ,第 19 一 24 行 的 for 循环 一 次 将 栈 S 中 的 
点 存放 到 q 中 。 注 意 存放 的 顺序 是 将 栈 的 数据 反 向 存 和 人 q, 这 样 a 中 的 点 就 是 凸 包 的 按 逆 
时 针 方 向 的 序列 了 。 

为 便于 重用 ,程序 5-7 和 程序 5-8 的 代码 保存 在 文件 夹 geometry 中 的 源 文件 convexhull. c 
H., PRA grahamScan 的 原型 声明 存储 在 同一 文件 夹 中 的 头 文 件 convexhull. h 中 。 


5.4 求 最 邻近 点 对 


现在 来 考虑 求 nS 2 个 点 的 集合 Q 中 最 邻近 点 对 的 问题 。“ 最 邻近 ” 指 的 是 欧 几 里 德 距 
离 : BUS bim Gr yi All pi Gro y ZTE BE BE / Cr, — 22)? (i). 集合 Q 的 两 
个 点 可 能 重合 ,此 时 ,它们 之 间 的 距离 为 零 。 这 个 问题 在 交通 控制 中 有 其 应 用 。 控 制 航空 或 
航海 交通 的 系统 为 了 检测 载体 之 间 洪 在 的 碰撞 ,可 能 需要 知道 哪 两 个 载体 最 邻近 。 

把 问题 形式 化 为 如 下 。 

输入 : 平面 点 集 Q. 

输出 : Q 中 最 邻近 点 对 的 距离 6。 


计算 最近 点 对 的 覃 力 算法 直接 查看 [ "| 一 BC) 个 点 对 。 在 本 节 中 ,将 描述 一 个 对 此 
问题 的 一 个 分 治 算法 ,其 运行 时 间 用 我 们 熟悉 的 递归 式 T(n) 二 2T(n/2) 十 O(n) 描 述 。 于 
是 ,此 算法 仅 用 O(nlgn) 时 间 。 


5.4.1 算法 描述 与 分 析 


1. 分 治 算法 


算法 的 每 一 次 递归 调用 以 子 集 PSQ 和 包含 P 中 点 的 数组 X RY 作为 输入 。 数 组 X 
中 的 点 按 横 坐标 的 单调 递增 排序 。 类 似 地 ,数组 Y 按 点 的 纵 坐 标 单调 增加 排序 。 为 了 达到 
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O(nlgn) 的 时 间 界 限 , 不 能 在 每 次 递归 调用 时 排序 。 如 果 这 样 ,递归 的 运行 时 间 将 变 成 
T(n) =2T(n/2) +OCrlgn) ,其 解 为 T(n) 二 O(nlg2n)。 稍 后 将 看 到 如 何 使 用 “ 预 排 序 ” 来 维 
持 这 一 顺序 特性 而 无 须 在 每 次 递归 调用 时 排序 。 

给 定 输入 为 PX 和 YY 的 一 次 递归 调用 ,首先 检测 是 否 |P| 三 3。 如 是 , 则 该 次 调用 直接 


执行 上 述 的 蛮 力 法 : 试探 所 有 | y ] 个 总 对 并 返回 最 分 近 点 对 。 车 |P| 二 3, 递 归 调 用 执行 


如 下 的 分 治 范例 。 

分 割 : 找 一 竖 线 1, 将 集合 P 分 成 两 半 Pi 和 Px ,使 得 |Pr|=[|P1/2 1.) Pel =LiP|/2 J, 
Pi 中 的 所 有 点 都 位 于 直线 1 上 或 其 左边 ,而 Pe 中 的 所 有 点 都 位 于 直线 1 上 或 其 右边 。 数 组 
X 被 分 成 两 部 分 XL 和 Xr, 分别 包 含 已 和 PR 的 点 ,并 按 横 坐标 的 单调 增加 排序 。 类 似 地 ， 
数组 Y 被 分 成 两 部 分 YL 和 Yx ,分 别 包含 PL 和 Pr 的 点 ,并 按 y 坐标 的 单调 增加 排序 。 

治理 : 把 P 分 割 成 Pi 和 Pr, 就 形成 两 个 递归 调用 ,一 个 是 求 Pi 的 最 邻近 点 对 , 另 一 个 
FER Pk 的 最 邻近 点 对 。 第 一 个 调用 的 输入 是 PL XLA Y, ,第 二 个 调用 的 输入 是 Pk .Xk 和 
Yr。 设 Pr 、Pr 的 最 邻近 点 对 的 距离 分 别 为 6L 和 6x, 并 设 O= min, ,6k)。 

合并 : 最 邻近 点 对 或 是 由 某 个 递归 调用 找到 的 距离 为 6 的 点 对 ,或 是 一 个 点 在 Pi 中 另 
一 个 点 在 Pr 中 的 点 对 。 算 法 判断 是 否 存在 这 样 的 距离 小 于 6 的 点 对 。 显 然 ,如 果 有 这 样 的 
距离 小 于 6 的 点 对 ,如 图 5-12(a) 所 示 , 这 样 的 点 必 落 在 对 称 于 直线 /、 宽 20 的 竖 直 条 状 区 域 
内 。 为 找到 这 样 的 点 对 ,算法 做 如 下 工作 。 

(1) 创建 数组 Y', 它 是 将 数组 Y 中 所 有 不 在 26 宽 的 条 形 区 域内 的 点 去 掉 的 结果 。 数 组 
Y'5j Y 一样 按 纵 坐 标 排序 。 

(2) 对 关中 的 每 个 点 ,算法 试图 在 YY 中 找 与 p 的 距离 小 于 6 的 点 。 在 YY 中 只 需要 考 
HE p 之 后 的 7 个 点 。 算 法 计算 从 p 到 这 7 个 点 的 距离 并 跟踪 在 Y 中 找到 的 最 邻近 点 对 的 
距离 9 。 

(3) 若 8 — 9, 则 条 状 区 域内 确实 包含 比 递 归 调 用 所 得 到 的 更 邻近 的 点 对 。 该 点 对 及 
其 距离 8 被 返回 ,否则 返回 由 递归 调用 得 到 最 邻近 点 对 及 其 距离 6。 
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5-12. 最 邻近 点 算法 


图 5-12 所 示 为 证 明 最 邻近 点 对 算法 对 数组 Y 中 的 每 个 点 只 需 检 测 其 后 的 7 个 点 的 关 
键 概念 。 图 5-12(a) 中 , 若 pr € Pi pr € Pr 的 距离 小 于 6, 则 必 居 于 关于 直线 DSERIS 0720 
的 矩形 中 。 图 5-12(b) 中 ,在 6X6 方 块 内 相距 至 少 6 单位 的 4 个 点 。 左边 是 Pi 中 的 4 个 
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点 ,右边 是 PR 中 的 4 个 点 ,共有 S 个 点 在 SX26 矩形 内 。 落 在 直线 /上 的 两 对 是 重合 的 。 
上 面 的 描述 省 略 了 一 些 为 获得 O(nlgn) 运 行 时 间 的 实现 细节 。 在 证 明了 算法 的 正确 性 
后 ,将 说 明 如 何 实 现 期 望 的 时 间 界 限 。 
CLOSEST-PAIR-POINTS(P, X,Y) 
1 if |PI<3 
2 then 蛮 力 计算 所 有 点 对 的 距离 并 返回 最 小 者 
3 计算 竖 直线 1 将 P 分 成 两 部 分 PL 和 Pr, 使 得 |Pi|=[|P|/21,|Pr|=L|P|/2] 
4 Xi PL 中 所 有 点 ,Xr<- Pr 中 所 有 点 ,并 按 横 坐标 的 升序 排 好 序 
5 YP 中 所 有 点 ,YR<-Pr 中 所 有 点 ,并 按 纵 坐标 的 升序 排 好 序 
6 6,~<-CLOSEST-PAIR-POINTS(P,; ,XL ,YL) 
7 6r<-CLOSEST-PAIR-POINTS(Pr » Xr Yr) 
8 d,<-min(d, ôr) 
9 d«-COMBINE(P ,/,0,,) 
10 d= min(ó, ,d) 
11 return à 
COMBINE (P,l,ò) 
1Y'«-P 中 所 有 位 于 以 1 为 中 轴线 ,宽度 为 26 的 带 状 区 域内 的 点 
2 X Y' 中 的 点 按 纵 坐标 升序 排序 
3 for Y’ 中 的 每 一 个 点 
4 do 计算 Y 中 所 有 距离 不 超过 6 的 顶点 距离 ,并 跟踪 最 小 者 为 d 


5 return d 


算法 5-6 解决 最 邻近 点 对 问题 的 算法 
2. 正确 性 


为 说 明 这 个 最 邻近 点 对 算法 的 正确 性 ,需要 考察 以 下 两 个 问题 。 首 先 , 当 |1P| 志 3 时 递 
归 到 底 ,保证 不 会 遇 到 划分 的 点 集 仅 有 一 个 点 ;其 次 ,只 需要 检测 Y 中 的 所 有 7 个 点 。 现 在 
就 来 证 明 这 一 特性 。 

假定 在 某 一 层 递 归 中 ,最 邻近 点 对 为 pL E€ Pi ,pr€ Pro FE pr 和 pr 之 间 的 距离 6' 必 
严格 小 于 8。 点 广 必 落 于 直线 ! 的 左边 或 1 上 ,并 且 距 离 小 于 6 个 单位 。 同 样 ,点 pr 必 落 于 
直线 1 的 右边 或 1 上 ,并 且 距 离 小 于 6 个 单位 。 此 外 ,pi 和 pr 在 竖 直 方向 上 的 距离 小 于 6。 
于 是 ,如 图 5-12(a) 所 示 ,pr 和 pr 落 于 对 称 于 1 的 6X26 的 矩形 区 域内 (此 矩形 区 域内 可 能 
还 有 其 他 的 点 ) 。 

下 面 来 证 明 在 OX 20 的 矩形 内 至 多 有 8 个 P 的 点 。 考 虑 该 矩形 右边 的 SX8 的 方块 。 
由 于 Pi 中 的 点 至 少 相 距 6 个 单位 ,因此 至 多 有 4 个 点 落 在 此 方块 中 ,如 图 5-12(b) 所 示 。 相 
似 地 ,至 多 有 4 个 Px 中 的 点 落 在 右 半 边 的 6X6 的 方块 中 。 于 是 ,至 多 8 个 P 中 的 点 居于 此 
6X26 的 矩形 内 (由 于 ! 上 的 点 可 能 既是 已 :的 也 是 PR 的 ,因此 ! 上 的 点 可 多 达 4 个 。 当 两 对 
点 重合 时 ,达到 此 极限 ,每 一 对 点 既是 Pi 的 也 是 PR 的 ,一 对 为 矩形 与 1 在 顶部 的 交点 , 另 一 
对 为 矩形 与 ! 在 底部 的 交点 ) 。 

说 明了 至 多 有 8 个 P 中 的 点 能 居于 此 和 矩形 内 ,就 不 难看 出 对 Y 中 的 每 一 个 点 ,只 需 检 
测 其 后 的 7 个 点 。 假 定 最 邻近 点 对 为 pr 和 pr» RA AE ELE YP pi FEF pe WIE 
iL 先 于 pr 多 远 ,pr 是 要 检测 的 7 个 点 之 一 。 这 就 说 明了 最 邻近 点 对 算法 的 正确 性 。 
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3. 实现 与 运行 时 间 


正如 已 经 指出 的 那样 ,我 们 的 目标 是 要 使 递归 的 运行 时 间 是 T) = 2T (n/2) +O) 
其 中 ,TG0) 为 对 个 点 的 集合 的 运行 时 间 。 主 要 的 困难 是 保证 数组 传递 给 递归 的 Xi Xr 
于 和 Yr 是 已 按 合适 的 坐标 排序 的 并 且 Y 是 按 纵 坐 标 排 好 序 的 (注意 车 递归 接受 的 数组 XX 
已 排序 , 则 将 P 划分 成 Pi 和 Px 很 容易 在 线性 时 间 内 完成 ) 。 

关键 是 在 每 次 调用 希望 对 一 个 有 序数 组 形成 一 个 有 序 的 子 集 。 例 如 ,一 次 调用 给 定子 
E P 和 按 y 坐标 排 好 序 的 数组 Y。 在 把 P 划分 成 Pi 和 Px 的 同时 ,要 形成 按 y 坐标 排 好 序 
的 数组 和 Yr。 此 外 ,这 些 数组 必须 在 线性 时 间 内 形成 。 这 一 方法 可 以 视 为 2.3.1 节 的 
合并 排序 过 程 MERGE 的 反 向 操作 : 要 把 一 个 已 排序 的 数组 分 裂 成 两 个 排 好 序 的 数组 。 以 
下 代码 给 出 了 这 一 想法 。 


1 length[Y,] < length[Yr] < 一 0 
2 for i<-1 to length[Y] 
3 do if Y[/]€ P, 
then /engthLY, ] —length[YL]+1 

Yr LtengthUY. 1] —-YLi1 
else length Y ] --lengthLYg ]--1 

Ys lengthLCYs 1] --YLi] 

算法 5-7 将 有 序列 表 Y 分 解 成 两 个 有 序 子 列表 YL 和 Yk 


依次 检测 数组 Y rp ex an ex Y Li fk Pi 中 ,将 其 扎 加 到 数组 YY 的 尾部 ,否则 追加 到 
Yr 的 尾部 。 对 数组 X.、Xk 和 YY 的 代码 是 相似 的 。 
所 剩 的 最 后 问题 是 如 何在 一 开始 就 使 所 有 的 点 都 排 好 序 。 直 接 对 其 预 排 序 来 解决 这 一 问 
题 , 即 在 第 一 次 递归 调用 前 就 把 它们 一 次 性 全 部 排 好 序 。 这 些 有 序数 组 传递 给 第 一 个 递归 调 
用 ,由 此 ,在 进一步 递归 调用 需要 的 时 候 对 其 进行 分 割 。 预 排序 增加 运行 时 间 OCzlgz) ,但 在 
每 一 步 递归 时 只 需 花费 线性 时 间 。 于 是 , 设 T(z) 为 每 一 步 递 归 时 间 ,T(z) 为 整个 算法 的 
2TG/2) -O() n3 


FEA T Cn) = Tn) + OCalgn) B T) 一 -是 , T(n)= 
时 间 , 有 n n nlgn) 和 T(n bonn ME n 


4 
5 
6 
7 


Olnlg) H. T’ (n)=Onlgn), 


5.4.2 程序 实现 


l. 蛮 力 算法 的 实现 
当 点 集 已 中 的 个 数 不 超过 3 时 ,用 下 列 函 数 计算 其 中 最 邻近 点 对 的 距离 。 


1 double force(Point * p,int n){ /* 计 算 最 邻近 点 对 距离 的 蛮 力 算法 实现 函数 */ 
2 double d= DBL MAX.t; 

3 int i,j; 

4 for(i=0;i<n;i ++) 

5 forj=i+1;j<n;j++){ 

6 t—distC &p[i], &p[ 3: 
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7 if(t<d) 
8 d=t; 
9 ) 

10 return d; 

11} 


程序 S-11 蛮 力 计算 点 集 最 邻近 点 对 距离 的 函数 


该 函数 的 第 一 个 参数 p 是 表示 平面 点 集 的 数组 p, 第 二 个 参数 n 表示 p 中 所 含 点 的 个 
数 。 函 数 返回 p 中 所 有 点 对 距离 的 最 小 者 。 

函数 体 中 定义 了 用 来 跟踪 最 邻近 点 对 距离 的 变量 d。 初 始 时 ,d 的 值 应 为 ,用 头 文件 
limits. h 中 定义 的 系统 常量 DBL_MAX 对 其 进行 初始 化 。 

第 4~~9 行 的 两 重典 套 for 循环 计算 p 中 所 有 pL] pL] (i 去 j) 之 间 的 距离 t, 只 要 t<d， 
就 将 d 改写 为 t。 这样, 循环 结束 时 ,d 记录 了 其 中 的 最 小 者 。 第 10 行将 d 返回。 


2. 合并 函数 


分 治 算法 CLOSEST-PAIR-POINTS 在 将 P 划分 为 PL 和 Pg, 并 对 已 和 PR 分 别 调用 自身 
分 治 后 ,还 用 调用 合并 过 程 COMBINE, 得 到 对 已 的 解 。 过 程 COMBINE 实现 如 下 。 


1 double combine(Point * y,int n.double Ix.double delta) ( 

2 int i,j; 

3 double d= DBL MAX.t; 

4 Point * yl— (Point * ) malloc(n * sizeof( Point) ) ; 

5 forG=0,j=0;i<n;i ++) /* Ye y PREH 2% delta 的 带 状 区 域内 的 子 集 置 于 yl * / 
6 if(fabs(y[i]. x—1x)<= delta) 

7 ylLi- -J- ys 

8 

9 


n=j; /* yl 中 的 元 素 个 数 * / 
for(i=0;i<n;i++){ / * 计算 yl 中 最 邻近 点 对 距离 * / 

10 for( j=1;i+j<n&.&j<8,j++){ 

1 t=dist(&yl(i],&ylli+j])s 

12 if(t<d) 

13 d=t; 

14 } 

15 } 


16 freeCyD ; 
17 return d; 


程序 5-12 实现 算法 5-4 中 COMBINE 过 程 的 C 函数 
对 程序 5-12 的 说 明 如 下 。 
(1) 函数 combine 的 参数 y 表示 点 集中 点 按 纵 坐 标 升 序 排 列 的 数组 ,参数 n 表示 y 中 
元 素 个 数 。 参 数 lx 表示 对 点 集 划 分 的 中 轴线 ,参数 delta 表示 对 点 集 的 两 个 划分 子 集 递归 
解 得 的 子 问 题解 的 较 小 者 。 该 函数 返回 点 集中 以 1x 为 中 轴线 ,宽度 为 2* delta 的 带 状 区 域 
内 最 邻近 点 对 距离 。 
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(2) 函数 体 中 ,第 4 行 定义 了 指向 点 集中 位 于 上 述 带 状 区 域内 点 组 成 的 数组 的 指针 yl 。 

(3) 第 5 一 7 行 的 for 循环 将 y 中 位 于 带 状 区 域内 的 元 素 依次 复制 到 yl 中 。 这 样 , 可 保 
证 yl 中 的 点 也 是 按 纵 坐标 升序 排列 。 第 9 一 15 行 对 yl 中 的 每 一 个 点 计算 与 其 邻近 的 7 个 
点 的 距离 ,跟踪 最 小 者 d. 


3. 计算 最 邻近 点 对 距离 


利用 程序 5-11 和 程序 5-12, 实 现 算法 5-6 计算 平面 点 集中 最 邻近 点 对 距离 的 函数 定义 
如 下 。 


1 double closestPairPoints(Point * x,Point * y,int n){ 

2 int half,k,i,j; 

3 double |x, deltal, deltar,delta,d; 

4 Point * xl, * xr, * yl, * yr; 

5 if(n<=3) /* 若 点 数 不 超 过 3, 蛮 力 计算 所 有 点 对 的 距离 并 返回 最 小 者 * / 
6 return force(x,n); 

7 half=n/2; 

8 xl— (Point * )malloc(half * sizeof( Point) ) , 

9 xr= (Point * )malloc((n-half) * sizeof(Point) ) , 

10 yl= (Point * ) mallocC half * sizeof( Point) ) , 

11 yr= (Point * )malloc((n-half) * sizeof( Point) ) ; 

12 assert xl8. 8. xr8. 8. yl 8. yr) ; 

13 memepy(xl, x, half) ; /* 将 x 按 点 的 横 坐 标 升序 分 解 成 两 个 集合 * / 
14 memcpy(xr,x+half,n— half) ; 

15 Ix— x[half]. x; 


16  for(k=i=j=0;k<n;k++) / 将 y 分 解 成 对 应 的 两 个 按 纵 坐 标 升序 集合 * / 
17 ifCy[k]. x< — Ix8- &i— — half) 

18 yli++]=y[k]; 

19 else 

20 yrlj++]=y[k]; 

21 deltal— closestPairPoints(xl, yl, half) ; /* 对 左 半 部 分 递归 * / 

22 deltar= closestPairPoints( xr, yr,n-half) ; / * 对 右 半 部 分 递归 */ 


23 delta= deltal< deltar?deltal: deltar; 
24 d=combine(y,n,lx,delta); 

25 free(xl) ;free(yl) ;free(xr) ;free(yr); 
26 return d<delta?d; delta; 


程序 5-13 ”计算 平面 点 集中 最 邻近 点 对 距离 的 C 函数 


对 程序 5-13 的 说 明 如 下 。 

(1) CLOSEST-PAIR-POINTS 过 程 一 共有 3 个 参数 : 平面 点 集 P,P 中 元 素 按 横 坐 标 升 
序 排列 后 的 序列 X 以 及 P 中 元 素 按 纵 坐 标 升序 排列 后 的 序列 Y。 作 为 实现 算法 的 程序 , 函 
数 closestPairPoints 只 需要 传递 排 好 序 的 序列 X ALY 就 可 以 了 ,这 两 个 参数 都 用 元 素 类 型 为 
Point 的 数组 x.y 表示 。 同 时 需要 参数 n 说 明 数 组 x.y 的 元 素 个 数 。CLOSEST-PAIR-POINTS 
过 程 返 回 点 集中 最 邻近 点 对 的 距离 8, 应 该 是 浮 点 型 的 。 所 以 函数 closestPairPoints 的 返回 
值 类 型 为 double 型 的 。 
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(2) 在 CLOSEST-PAIR-POINTS 过 程 中 要 对 X 和 YY 分 解 ,分 解 后 的 子 向 量 为 Xia Xr 
YL 、Yk。 同 时 还 需要 设置 下 一 层 递 归 返 回 值 6,、6x, 两 者 的 最 小 值 6,, 以 及 合并 过 程 
COMBINE 的 返回 值 4。 在 程序 中 ,用 指针 zi、zr、yl、yr 指向 的 动态 数组 表示 XL、Xk、YL、 
Yro J deltal、deltar、delta 表示 ô; „Ôr ,6, COMBINE 的 返回 值 d 用 同名 的 d 表示 。 

G) 函数 体 中 第 5 行 和 第 6 行 对 p 中 点 数 n 不 超过 3 的 情形 调用 程序 5-11 定义 的 函数 
force 强力 计算 最 邻近 点 对 距离 。 第 13 行 和 第 14 行 完 成 对 x 的 划分 ,将 前 一 半 x[0..n/2 一 1] 
复制 给 xl,x[n/2..nj 复 制 给 xr。 第 15 一 20 行 是 按 算法 5-6 实现 的 对 y 的 划分 。 第 21 行 和 第 
22 行 分 别 对 xl, yl 及 xr, yr 进行 递归 操作 ,返回 deltal 和 deltar。 第 23 行 计算 deltal 和 
deltar 的 最 小 者 ,第 24 行 调用 程序 5-12 中 定义 的 函数 combine 计算 y 中 以 lx 为 中 轴 , 宽 度 
为 2* delta 的 区 域内 最 邻近 点 对 距离 。 第 26 行 返回 y 中 最 邻近 点 对 距离 。 

程序 5-11 至 程序 5-13 定义 的 函数 存储 在 文件 夹 geometry 中 的 源 文件 closestpairpoints. c 
H, KX closestPairPoints 的 原型 声明 存储 在 同一 文件 夹 中 的 头 文件 closestpairpoints. 
hp, 


5.5 应 用 


5.5.1 光 导 管 


PiPe 


The GX Light Pipeline Company started to prepare bent pipes for the new 
transgalactic light pipeline. During the design phase of the new pipe shape the company 
ran into the problem of determining how far the light can reach inside each component of 
the pipe. Note that the material which the pipe is made from is not transparent and not 


light reflecting. 


Ga Y4) 


513 ER 


Each pipe component consists of many straight pipes connected tightly together. For 
the programming purposes.the company developed the description of each component as a 
sequence of points Gri » yı)» (£25 yz) s**t (ans Yn) s where zı <r: 7 —r,. These are the 
upper points of the pipe contour. The bottom points of the pipe contour consist of points 
with y-coordinate decreased by 1. To each upper point (r;.y;) there is a corresponding 
bottom point Cr;.y; — 1) (see picture above). The company wants to find. for each pipe 


component ,the point with maximal 2x-coordinate that the light will reach. The light is 
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emitted by a segment source with endpoints Cz;. y; — 1) and (zi, yi) (endpoints are 
emitting light too). Assume that the light is not bent at the pipe bent points and the bent 
points do not stop the light beam. 

Input 

The input file contains several blocks each describing one pipe component. Each block 
starts with the number of bent points 2<n<20 on separate line. Each of the next n lines 
contains a pair of real values z;.y; separated by space. The last block is denoted with n=0. 

Output 

The output file contains lines corresponding to blocks in input file. To each block in 
the input file there is one line in the output file. Each such line contains either a real value. 
written with precision of two decimal places.or the message through all the pipe. The real 
value is the desired maximal x-coordinate of the point where the light can reach from the 
source for corresponding pipe component. If this value equals to z,.then the message 
through all the pipe. will appear in the output file. 

Sample Input 


4 

01 

22 

41 

64 

6 

01 
2—0.6 
5—4.45 
7—5.57 
12—10.8 
17—16.55 
0 


Sample Output 
4.67 


Through all the pipe. 


l. 问题 描述 与 分 析 


光缆 公司 设计 一 条 光 导 管 , 它 由 若干 条 光线 不 能 穿 透 管 辟 、 壁 管材 料 也 不 能 反射 光线 的 
直 管 段 连接 而 成 (如 图 5-13 所 示 )。 连 接 处 的 顶部 坐标 为 (x;,y;) ,底部 坐标 为 (xi,y; 一 1)， 
i—1.2.eanay ay morus JEZR AES 1 的 入口 处 射 人 。 对 给 定 接口 顶部 坐标 序列 
Gr yid Gras y22 e (rsy)( 隐 含 地 给 出 了 接口 底部 的 坐标 (zi ,一 1),(zs,yz 一 1),…， 
Cr, 一 1)) 的 管道 设计 方案 , 问 从 入 口 射 人 的 光线 最 多 能 传送 多 远 ? 问题 的 形式 化 表述 为 
如 下 。 
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输入 : 管道 连接 处 顶部 坐标 序列 (zi iD Cre oye) et Gn Yn) an org m x, CR 
含 地 给 出 了 接口 底部 的 坐标 (zy 一 1),(Cza y — D t Gr, y, Do 

输出 : 若 光 线 能 穿 透 整个 管道 则 输出 “ 穿 透 " 信 息 ;否则 ,输出 从 入 口 射 人 光线 能 在 管道 
中 传送 的 最 远 距离 。 

此 问题 中 , 设 光线 穿 透 第 i 根 管子 的 角度 (光线 与 水 平 线 的 夹 角 ) 范 围 为 [loww; ,up;]( 见 
图 5-14), 对 于 光线 能 穿 透 整个 管道 的 条 件 比较 简单 : [7 Clow, up JA De 


图 5-14 光线 通 透 管子 的 角度 


对 光线 不 能 穿 透 整 条 管道 的 情形 , 先 给 出 如 下 结论 。 

(1) 最 长 光线 至 少 擦 过 一 个 连接 口 的 顶部 或 底部 。 

(2) 最 长 光线 必 控 过 一 个 接口 的 顶部 , 另 一 个 接口 的 底部 。 

对 于 结论 (1) ,如 果 最 长 光线 不 擦 过 任何 一 个 接口 处 的 顶部 或 底部 , 则 经 过 适当 的 调整 
射 人 光线 角度 ,就 可 得 到 一 条 从 入 口 射 入 , 擦 过 某 个 接口 处 的 项 部 或 底部 , 且 比 原来 的 光线 
更 长 的 光线 。 

对 于 结论 (2) ,不 失 一 般 性 ,假定 最 长 光线 仅 擦 过 若干 个 接口 顶部 ,也 可 以 通过 适当 调整 
射 人 光线 角度 ,而 得 到 一 条 从 入 口 射 人 ,在 管道 内 擦 过 某 个 接口 的 项 部, 且 擦 过 某 个 接口 的 
底部 的 更 长 的 光线 。 


2. 算法 描述 


根据 上 述 两 个 结论 ,可 以 先 计算 出 光线 通过 每 一 段 管 子 的 角度 范围 Dow, 和 xp, 并 以 此 
算出 从 入 口 开始 能 在 管道 中 穿 过 的 最 长 距离 。 


PIPECr, y) 

l intersection «-( —99,4- c9) 

2 kel 

3 repeat 

4 low~ Hk RAF ORD AR A 
5 up 第 4 段 管子 的 最 大 人 射 角 
6 intersection < intersection N [low ups] 
7 k< k+l 

8 until k>n or intersection Ø 

9 if intersectionz- Ø 

10 then return ^^ 

11k < 1,len <0 
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12 intersection < intersection— [ low, «up, ] 
13 for each 管 路 中 的 拐角 点 对 ab 
14 ”do a a,b ERAH fa 


15 if a€ intersection 

16 then temp < a.b 连 线 从 人 射 点 到 在 管 路 中 第 1 次 碰壁 处 长 度 
17 if temp>len 

18 then len < temp 


19 return len 
算法 5-8 ”解决 PiPe 问题 的 算法 过 程 
算法 运行 如 下 。 第 3—8 行 的 repeat-until 循环 依次 计算 每 一 根 管道 的 最 大 /最 小 光线 
入 射 角 (光线 与 横 轴 正 向 夹 角 )Lor 和 wp;, 并 计算 (C) $, Clow: ups 1k <n), H 9 行 检测 条 
件 门 _,[iowisup1] 去 是 否 成 立 。 若是 ,意味 着 光线 可 穿 透 整个 管 路 ,返回 号 。 否 则 ,第 
12 行 在 交集 i Dow sup] = S PRERJA KEE K HKA Cow ,upi], 这 样 必 有 
(low, ups] AD. 1217 行 的 for 循环 逐一 对 管 路 中 拐角 点 对 的 连 线 检测 与 横 轴 
正 向 夹 角 是 否 在 [E Clow, up, ] 范围 内 。 若 是 ,计算 该 连 线 在 管 路 中 与 管子 碰壁 处 距 身 
入 点 的 长 度 。 跟 踪 最 大 者 len。 循 环 结束 时 ,第 19 行 返回 Len。 


3. 程序 实现 


1) 计算 光线 的 入 射 角 

与 计算 向 量 的 极 角 有 所 不 同 , 光 线 1 的 入 射 角 a 定义 为 光线 与 x 轴 正 向 的 夹 角 , 即 
一 x<a<x。 计 算 过 点 ab 的 直线 与 x 轴 夹 角 近 似 值 的 过 程 实现 如 下 。 

1 double psudoAngle(Point * a,Point * b){ 

2 Point pl=sub(a,b); 

3 assert(pabs( &-pl1)> = epsilon) ; 

4 normalize(&-p1); 

5 return pl. y; 

6) 

程序 5-14 计算 点 ab ERA x 轴 正 向 夹 角 近 似 值 的 C 函数 


函数 中 第 2 行 计算 连接 点 ab 的 向 量 pl。 第 4 行将 pl 规格 化 (使 其 模 长 为 1) ,第 5 行 
用 pl 的 纵 坐 标 作为 pl 5j ac 轴 正 向 夹 角 的 近似 值 返回 。 

2) 计算 线段 交点 

线段 所 在 直线 对 应 一 个 二 元 一 次 方程 。 两 条 相交 线段 可 表 为 一 个 二 元 一 次 方程 组 
Rubin 


ag tdg y 7b; 


an bi bi ar an Qu 


令 解 出 该 方程 组 da = mh 及 d= , 解 该 


an b b; az 
方程 xo —d,/d yo 二 d,/d,(zxo，yo) 即 为 相交 线段 的 交点 坐标 。 程 序 5-15 就 是 用 此 方法 计 
算 相交 线段 交点 的 。 


an 42 


1 Point jointPoint(Point * pl,Point * p2,Point * p3,Point * p4)( 
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€ 0 -3 Oo c & Qt 


10 
11} 


double all,al2,a21,a22,bl,b2,d,dx,dy; 

Point p; 

all—(p2-»y— pl-»y):al2—(pl-»x— p2-»x):bl-all * (p2->x) +al2 * (p2->y); 
a21 — (p4-» y— p3—> y) ;a22= (p3—> x— p4-> x) ;b2—a21 * (p4—> x) +022 * (p4->y); 
d=all * a22— a21 * al2; 

dx 一 bl * a22— b2 * a12; 

dy=all * b2—a21 * bl; 

p. x7 dx/dip. y=dy/d; 

return p; 


程序 5-15 计算 相交 线段 pl p2 与 线段 p3、p4 交点 的 C 函数 


程序 中 第 4 行 和 第 5 行 根据 点 pl、p2、p3、p4 的 坐标 计算 方程 组 系数 all、al2、bl、a21、 
a22,b2, 58 6 一 8 行 计 算 d dx 和 dy。 第 9 行 计算 交点 p 的 横 坐 标 dx/d、 纵 坐标 dy/d, 第 
9 行 返回 p。 

为 便于 代码 重用 ,将 程序 5-15 存在 geometry 文件 夹 中 的 头 文件 point. hK RUR 
明 ) 及 源 文件 point. ce( 函 数 定义 代码 ) 中 。 

3) 计算 光线 在 管 路 中 的 长 度 

接 下 来 实现 过 管 路 中 两 个 拐角 顶点 的 光线 的 长 度 的 计算 函数 。 


1 
2 
3 
4 
5 
6 
7 
8 
9 


10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 


double calculate(double * x,double * y,int i, int j,int iup,int jup, int n) ( 


int k; 
Point a,b, left. right. ps / * 计算 过 点 a,b AYRE left. right * / 
a. x7 xLi]ib. x= x[j]; / * YI a,b * / 


a, y—iup?yLi]:yLi]— 1; 

b. y 一 jup?y[j]:y[j] 一 1; 

left. x= x[0];right. x—x[n—1]; /* 左 、 右 端点 的 横 坐 标 * / 
left. y= (b. y—a. y)/(b. x—a. x) * Cleft. x—a. x) +a. ys /* 左 端点 的 纵 坐 标 * / 
right. y= (b. y—a. y)/(b. x—a. x) * (right. x—a. x) 十 a. y; /* 右 端点 的 纵 坐 标 * / 


a. x 一 x[j];a. y=jup?yljJ—1:ylj]s /* 第 j 段 管子 管 壁 起 点 * / 

b. x=x[j+1];b. y=jup?y[lj+1]—1:y[lj+1]; /* 第 j 段 管子 的 终点 * / 

if segmentsIntersect( 8-a , &b, & left, & right) ) { / * X? ab Ml left, right 相交 */ 
p=jointPoint( &a, &b, &-right, & left) ; / * 计算 交点 * / 
return dist(&left,&-p) ; / * 计算 光束 长 度 * / 

) 

k=j+1; 

while(k<n—1){ / * 从 第 j 十 1 段 管子 起 搜索 left right 相交 的 管 壁 * / 


a. x= x[k];a. y=y[k]; 

b. x=x[k+1];b. y=y[k+1]; 

if(segmentsIntersect( &-a, & b, & left, &-right) ) { 
p=intersection( &a, &-b, & right, & left) ; 
return dist(&-left, &p) ; 

} 

ay-—iby--—i 

if(segmentsIntersect( &-a, &-b, & left, & right) ) { 
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26 p= intersection( &-a, &-b, & right, & left) ; 
27 return dist &left, &-p) ; 

28 ) 

29 k++; 

30 ] 

31) 


程序 5-16 计算 过 管 路 中 两 个 拐角 点 的 光线 在 管 路 中 碰壁 前 的 长 度 


对 程序 5-16 的 说 明 如 下 。 

(1) 参数 x A y 分 别 表 示 各 管子 上 边缘 端点 的 横 坐 标 数组 和 纵 坐 标 数组 。 参 数 n 表示 
构成 管 路 的 管子 数 。 参 数 i 和 j 分 别 表示 前 后 两 个 拐角 的 编号 。 参 数 up jup 分 别 表示 前 
后 两 个 拐角 点 是 否 为 上 边缘 的 。 函 数 计算 返回 过 由 ij iup jup 决定 的 两 个 拐角 点 的 光线 
在 管 路 中 首次 碰壁 前 的 长 度 。 

(2) 第 7 行 决定 光线 上 两 点 left 和 rightCleft 位 于 管 路 入 口 处 ,right 位 于 管 路 出 口 处 ) 
的 横 坐 标 。 第 8 行 和 第 9 行 根据 两 个 拐角 点 a、b( 第 4 一 6 行 根据 参数 x y ij iup jup 计算 
而 得 ) 计 算出 光线 上 left 处 的 纵 坐 标 和 right 处 的 纵 坐 标 ( 用 解析 几何 中 直线 的 两 点 式 方程 
计算 )。 第 10 行 和 第 11 行 计算 出 第 j 段 管子 可 能 与 光线 相交 的 关闭 端点 ab。 第 12 行 通 
过 调用 程序 5-2 中 定义 的 函数 segmentsIntersect 检测 线段 left, right 与 线段 a、b 是 否 相 交 。 
若是 ,第 13 行 调用 程序 5-15 定义 的 函数 jointPoint 计算 两 者 的 焦点 p, 第 14 行 调用 程 
序 5-1 中 定义 的 函数 dist 计算 left,p 之 间 的 距离 作为 函数 值 返 回 。 

(3) 若 第 12 行 的 检测 不 真 ,及 线段 left right 并 不 与 a、b 相交 ,第 17 一 30 行 的 while (ff 
环 从 第 j 十 1 根 管 子 起 逐一 检测 管 壁 是 否 与 left right 相交 ,一 旦 检测 到 相交 的 情况 ,计算 出 
left 到 交点 p 的 距离 即 为 所 求 ,并 加 以 返回 。 

4) 计算 最 长 光线 

做 好 这 些 准备 工作 后 ,把 算法 5-7 实现 为 如 下 C 函数 。 


1 double pipe(double * x,double * y,int n){ 

2 double anglel ,angle2 ,len=0,1=— DBL_MAX,u=DBL_MAX, low, up; 
3 int i=1,j; 

4 Point a,b,c,d; 

5 dof /* 计 算 通过 各 个 管子 光线 人 射 最 大 角度 .最 小 角度 跟踪 公共 角度 范围 * / 
6 double ml ,m2; 

7 low=1; 

8 up 一 ui 

9 a. x=x[i—1],a. y=y[i—1],b. x=x[i],b. y= yliJ—1; 

10 anglel = psudoAngle( &-b, &-a) ; 

11 a. y=yli—1]—1sb. y=yLi]; 

12 angle2— psudoAngle( &b, &a) ; 

13 ml=(anglel<angle2) ?anglel ; angle2 ; 

14 m2=anglel +angle2—ml; 

15 if(m1 >D 

16 l=ml; 

17 if(m2<u) 
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18 u—m2; 

19 i++; 

20 }whileCi<n&-&1<=u); 

21 if(ülc-u /* 穿 透 */ 

22 return DBL MAX; 

23 forGi=0;i<n—1;i++){ /= 计算 过 每 对 合法 点 光 东 的 长 度 ,跟踪 最 大 者 * / 
24 a, x—b. x=x[i];a. y yLi];b. y yLi]—1; /* BUR / 

25 for(j=it1;j<n;j++){ 

26 double temp; 

27 c. x=d. x=x[j];c. y=y[j];d. y=y[j]—1; /* 右边 点 */ 

28 anglel = psudoAngle( &a, &-d) ; / * 过 线段 ad 光线 的 人 射 角 * / 
29 if(anglel — low8-8-anglel — — up) { 

30 temp=calculate(x,y,i,j,1,0,n); 

Si if(temp>len) 

32 len= temp; 

33 } 

34 anglel = psudoAngle( &b, &-c) ; / * 过 线段 bc 光线 的 入射 角 * / 
35 if(anglel >= low8&-&-anglel— — up) ( 

36 temp- calculate(x; y»i,j 051,0); 

37 if(temp- len) 

38 len= temp; 

39 ) 

40 } 

41} 

42 return len; 

43 } 


程序 5-17 实现 算法 5-6 的 C 函数 


对 程序 5-17 的 说 明 如 下 。 

COD 第 5 一 20 行 的 do-while 循环 实现 算法 过 程 中 第 3 一 8 行 的 repeat-until 循环 ,逐一 计 
算 各 根 管子 光线 的 最 大 入 射 角 .最 小 人 射 角 ,计算 它们 的 交集 。 交 集 为 一 区 间 , 左 端点 为 !， 
右 端点 为 w。 当 此 交集 为 空 时 (1 二 或 所 有 管子 的 光线 射 人 角 的 允许 范围 交集 非 空 ,循环 
WR. dre RAE Guo ,意味 着 光线 可 从 入 口 穿 透 整 个 管 路 ,第 22 行 返回 DBL_MAX, 代 
表 光 线 无 穷 长 。 

(2) 第 23 一 41 行 的 两 重 for 循环 对 n(n 一 1) 对 管子 拐角 点 连 线 逐一 检测 其 入 射 角 ( 调 
用 程序 5-14 定义 的 函数 psudoAngle 计算 ) 是 否 介 于 1、u 之 间 。 若 是 ,调用 程序 5-16 定义 的 
calculate 函数 计算 着 一 条 光线 在 管 路 中 的 长 度 ,跟踪 最 大 者 lens 

5) 主 函 数 

下 列 主 函数 最 终 解决 PiPe 问题 。 


1 int main(){ 

2 double * x— NULL, * y- NULL, * yl=NULL, length; 
3 int n.i; 

4 FILE * f1— fopen("chap05/Pipe/inputdata. txt" ,"r"), 
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5 * {2=fopen("chap05/Pipe/outputdata. txt" ," w"); 

6  assert(f1& &-f2); 

7 fscanf(f1,"%d",8-n); /* 读 取 案 例 数 n* / 
8 while(n>0){ 

9 if(x) free(x) ; 

10 if(y) free(y) ; 

11 assert(x= (double * )malloc(n * sizeof( double) ) ) ; 

12 assert C y= (double * ) malloc(n * sizeof( double) )) ; 

13 forG=0;i<n;i ++) /* 读 取 案 例 数据 * / 
14 fscanf(fl,"%1f%1f" xis y Ds 

15 length— pipe(x.y.n); / * 计算 光 束 长 度 * / 
16 if(length 一 一 DBL_MAX) /* 穿 透 */ 

17 ÍprintfCf2, " Through all the pipe. \n"); 

18 else 

19 ÍprintfCf2, " 4. 2f\n", length) ; /*#* 最 长 的 光 东 长 度 * / 
20 fscanf({1,"%d",&n) ; 

21 } 


22  freeGO ;free(y) ;free(yl); 
23 fclose(f1) ; fclose({2) ; 


24 return 0; 


BF 5-18 解决 PiPe 问题 的 C 程序 


对 程序 5-18 的 说 明 如 下 。 

CD 第 8 一 21 行 的 while 循环 处 理 输入 文件 中 的 每 一 个 案例 。 其 中 ,第 11 行 和 第 12 行 
对 xy 分 配 了 动态 数组 空间 ,第 13 行 和 第 14 行 的 for 循环 从 输入 文件 中 逐一 读 取 各 根 管 
子 上 沿 端点 坐标 ,存储 于 x、y 中 。 

(2) 第 15 行 调用 程序 5-17 定义 的 函数 pipe 计算 本 案例 管 路 中 最 长 光线 长 度 length, 

G) 第 16 一 18 行 的 if-else 语句 根据 length 的 不 同情 况 向 输出 文件 写 入 相应 的 信息 。 
其 中 , 当 光 线 穿 透 管 路 时 (length Jg 950 ,第 17 行 向 输出 文件 写 入 信息 "Through all the 
pipe." ,否则 第 19 行 向 输出 文件 写 入 length 的 值 。 

程序 5-15 至 程序 5-18 存储 在 文件 夹 chap05/pipe 中 的 源 文件 pipe. c 中 ,读者 可 打开 文 
件 研 读 并 试 运行 。 


5.5.2 最 小 边界 矩形 


Smallest Bounding Rectangle 


Given the Cartesian coordinates of n(>0) 2-dimensional points. write a program that 
computes the area of their smallest bounding rectangle (smallest rectangle containing all 


the given points). 
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Input 

The input file may contain multiple test cases. Each test case begins with a line 
containing a positive integer n(— 1001) indicating the number of points in this test case. 
Then follows n lines each containing two real numbers giving espectively the z-and y 
coordinates of a point. The input terminates with a test case containing a value 0 for n 
which must not be processed. 

Output 

For each test case in the input print a line containing the area of the smallest bounding 
rectangle rounded to the 4th digit after the decimal point. 


Sample Input 


3 

3. 000 5. 000 

7. 000 9. 000 
17. 000 5. 000 
4 

0. 000 10. 000 
10. 000 20. 000 
20. 000 20. 000 
20. 000 10. 000 
0 


Sample Output 


56. 0000 
200. 0000 


l. 问题 描述 与 分 析 


本 题 的 题 面 是 很 直 白 的 ,形式 化 表述 为 如 下 。 

输入 : 平面 点 集 Q。 

输出 : 平面 上 涵盖 Q 的 最 小 矩形 面积 。 

为 解决 此 问题 , 先 给 出 以 下 结论 。 

设 平面 点 集 Q 的 凸 壳 为 CHO) ,涵盖 Q 的 最 小 矩形 R 也 是 涵盖 CH(CQ) 的 最 小 矩形 。 
并 且 , 至 少 有 CH(CQ) 的 一 条 边 在 R 的 一 条 边 上 。 

根据 这 一 结论 ,可 以 把 计算 Q 的 最 小 覆盖 矩形 转化 为 计算 CH(Q) 的 最 小 覆盖 矩形 。 
it CH(Q) 有 h 条 边 , 则 计算 与 CH(Q) 每 一 条 边 重 合 一 条 边 的 最 小 覆盖 矩形 , 求 其 中 的 最 小 
者 。 可 以 用 下 列 方法 计算 与 CH(Q) 一 条 边 相 重 的 最 小 覆盖 矩形 , 设 CH(Q) 的 一 条 边 与 y 
轴 正 向 夹 角 为 0, 则 将 CH(Q) 的 所 有 点 旋转 0, 然后 求 出 旋转 得 到 点 集中 最 小 /大 横 坐 标 , 最 
小 /最 大 纵 坐 标 , 就 可 得 到 覆盖 CH(CQ) 的 矩形 。 


2. 算法 描述 
SMALLEST-BOUNDING-RECTANGLE(Q) 
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1 P<CHCQ) 

2 arer < co 

3 for P 的 每 一 条 边 ; 

4 dod<s Sy 轴 正 向 夹 角 

5 P'—P 旋转 0 

6 Emin s Trax * Vmin » Ynax 已 中 点 的 最 小 /大 横 / 纵 坐标 
7 a < (Xmax 7 Tmin ) X (Ymax — Ymin ) 

8 if a<arer 

9 then arer <a 


10 return arer 


算法 5-9 解决 Smallest Bounding Rectangle 问题 的 算法 过 程 
3. 程序 实现 
把 矩形 表示 成 如 下 数据 类 型 。 


typedef struct { 
double width; / * FEE * / 
double height; "LE * / 
} Rectangle; 


1) 平面 点 的 比较 
由 于 在 计算 过 程 中 需要 找到 点 集中 处 于 最 左 者 、 最 右 者 、 最 高 者 及 最 低 者 ,这 些 点 都 可 以 
调用 程序 5-7 中 定义 的 函数 most 求 得 。 然 而 ,需要 为 传递 给 most 的 点 的 大 小 比较 定义 函数 。 


1 static int pxgreater(Point * a,Point * b){ /* 平 面 点 按 横 坐 标 比较 大 小 */ 
2 if(a->x>b->x) 

3 return 1; 

4 if(a-» x<b->x) 

5 return —1; 

6 return 0; 

T3} 

8 static int pxless(Point * a,Point * b){ 

9 return-pxgreater(a. b) ; 

10 } 

11 static int pygreater(Point * a,Point * b)( /* 平 面 点 按 纵 坐标 比较 大 小 * / 
12 if(a->y>b->y) 

13 return 1; 

14 if(a->y<b->y) 

15 return —1; 

16 return 0; 

17) 


18 static int pyless(Point * a,Point * b){ 
19 return — pygreater(a. b) ; 
20) 


程序 5-19 平面 点 按 横 坐标 、 纵 坐标 比较 大 小 的 C 函数 
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第 1 一 7 行 定 义 的 函数 pxgreater 比较 点 a,b 的 横 坐 标 ,前 者 大 则 返回 1; 后 者 大 则 返回 
一 1; 两 者 相等 则 返回 0。 第 8 一 10 行 定义 的 函数 pxless, 按 与 pxgreater 相反 的 方向 比较 点 
a.b 的 横 坐 标 大 小 。 这 只 要 返回 调用 pxgreater 的 相反 数 即 可 。 

第 11 一 17 行 定义 的 函数 pygreater, 以 及 第 18 行 和 第 19 行 定义 的 函数 pyless 比较 点 
a,b 的 纵 坐 标 大 小 ,代码 与 pxgreater、pxless 的 相似 ,读者 可 比较 研读 。 

2) 平面 点 集 的 旋转 


void pointRotate(Point * p,double theta) ( 
double x= (p-> x) * cos(theta) — (p-» y) * sinCtheta) , 
y=(p->x) * sin(theta) + Cp-» y) * cosCtheta) ; 
p->x=x; 


1 

2 

3 

4 

5 p->y=ys 
6 } 

7 

8 

9 


static void chRotate(Point * x,int n,double theta) ( / * AR x WEF theta ffi * / 
int i; 
for(i=0;i<n;i 十 十 ) 
10 pointRotate(x+i, theta) ; /* 点 xLiTlE RE theta ffi * / 
11} 


程序 5-20 ”计算 平面 点 集 旋转 的 C 函数 


对 程序 5-20 的 说 明 如 下 。 
平面 解析 几何 告诉 我 们 , 若 坐 标 系 zxOy 旋转 0 角形 成 的 新 
的 坐标 系 记 为 xz'Oy’( 见 图 5-15)。 则 Oy 中 一 点 (x.y) 在 
a Oy 中 的 坐标 (zx y ) 满 足 方程 : 
= zcos0 — ysin0 


y' = zsin0 + ycosó 

第 1~6 行 定 义 的 函数 pointRotate 就 是 按照 这 一 方程 计 
算 点 p 在 旋转 了 0 角 后 新 的 坐标 系 中 的 坐标 。 而 第 7 一 11 行 定 
义 的 函数 chRotate 对 存储 在 数组 x 中 的 n 个 点 ,计算 旋转 0 角 后 新 的 坐标 。 其 中 ,第 10 行 
调用 pointRotate 函数 计算 第 i 个 点 的 新 坐标 。 

为 便于 代码 重用 ,将 程序 5-20 添加 到 文件 夹 geometry 中 的 头 文件 point. h 和 源 文件 
point, c 中 。 

3) 计算 最 小 覆盖 和 矩形 

做 好 这 些 准备 工作 后 ,我 们 来 实现 算法 5-9. 


图 5-15 坐标 旋转 


Rectangle smallestBoundingRectangle(Point * q,int n){ / * 计算 点 集 q 的 最 小 覆盖 和 矩形 * / 
Rectangle result; 
int i,j.m; 
Point * p—grahamScan(q.n. &-m) , / * 计算 点 集 q 的 凸 包 p* / 


a; 

double minimx, maxmx, minimy, maxmy ,area— DBL_MAX, temp; 

for(i=0,j=0;i<m;i++.j++){ / * 对 凸 包 的 每 一 条 边 计算 外 接 和 矩形 面积 * / 
double tg,0; 


o - Oo Oc & Qo tw c 
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9 a 一 sub(p 十 ((j 十 1)%m),p 十 D; /= 一 条 边 ax/ 

10 tg—a. y/a. x; /* 边 a 的 斜率 * / 

11 theta 一 PI/2 一 atan(tg); /= 旋转 后 边 a 垂直 的 旋转 角 * / 
12 chRotate(p,m,6); /< 旋转 */ 

13 minimx=p[most(p,m,sizeof(Point) ,pxless)]. x; — /* 凸 包 最 左边 点 横 坐标 * / 
14 maxmx= p[most(p,m,sizeof(Point) ,pxgreater)]. x; / * 最 右边 点 横 坐 标 * / 

15 minimy— p[ most( p,m, sizeof(Point) ,pyless)]. y; /=* 最 下 边 点 纵 坐 标 * / 

16 maxmy=p[most(p,m,sizeof( Point) ,pygreater) ]. ys. /* 最 上 边 点 纵 坐标 * / 

17 temp 一 (maxmx-minimx) * (maxmy-minimy) ; /* 覆 盖 凸 包 和 矩形 面积 */ 
18 if(temp<area) ( /* 跟 踪 最 小 者 * / 

19 area— temp; 

20 result. height— (maxmy-minimy) ; 

21 result. width= (maxmx-minimx) ; 

22 } 

23 ) 

24 free(p); 

25 return result; 

26 } 


程序 5-21 实现 算法 5-9 的 C 函数 


对 程序 5-21 的 说 明 如 下 。 

(1) 函数 smallestBoundingRectangle 拥有 两 个 参数 ,数组 q 存储 了 n 个 Point 类 型 的 
元 素 。 与 算法 稍 有 不 同 ,函数 返回 的 是 面积 最 小 的 覆盖 q 的 Rectangle 数据 ,而 不 是 矩形 的 
面积 值 。 

(2) 第 7 一 23 行 的 for 循环 实现 算法 过 程 中 第 3 一 9 行 的 操作 ,对 由 第 4 行 计算 得 到 的 
点 集 q 的 凸 包 p 的 每 一 条 边 计算 与 此 共 边 的 覆盖 q 的 矩形 ,跟踪 面积 最 小 者 。 

G) 循环 体 中 ,第 9 行 调用 程序 5-1 中 定义 的 函数 sub 计算 凸 包 pL0..m— 1 ]H Wi 4 fil 
邻 顶点 的 差 得 到 线段 的 向 量 表示 a。 注 意 由 于 pLm 一 1] 与 pL0] 相 邻 ,所 以 两 个 相 邻 顶点 的 
地 址 分 别 表示 为 pHj 和 p 十 (Gj 十 1)%m。 第 10 行 和 第 11 行 计 算 该 边 需要 旋转 的 角度 0( 其 
中 需要 调用 库 函 数 atan 计算 反正 切 ) ,完成 算法 中 第 4 行 的 操作 。 第 12 行 调用 程序 5-20 定 
义 的 函数 chRotate ,旋转 p 中 每 一 个 点 ,使 得 线段 a 垂直 于 新 坐标 系 的 横 坐 标 轴 , 对 应 算法 
中 第 5 行 的 操作 。 第 13 一 16 行 调用 程序 5-8 定义 的 函数 most, 分 别 计算 凸 包 中 最 左 、 最 右 
点 的 横 坐 标 , 最 高 和 最 低 点 的 纵 坐标 ,完成 算法 过 程 中 第 6 行 的 操作 。 第 8 一 22 行 跟踪 面积 
最 小 的 矩形 result, 

为 便于 代码 重用 ,将 程序 5-19 和 程序 5-21 存储 在 文件 夹 chap05 中 的 源 文件 overlaprec- 
tangle. c 中 ,将 函数 smallestBoundingRectangle 的 原型 声明 存储 在 头 文件 overlaprectangle. h 
中 。 其 他 函数 之 所 以 定义 成 静态 的 static 型 ,是 因为 它们 是 仅 被 smallestBoundingRectangle 
函数 所 调用 的 功能 函数 。 

4) 主 函 数 

利用 前 面 做 好 的 准备 工作 ,编写 如 下 解决 Smallest Bounding Rectangle 问题 的 程序 。 


1 int main(){ 
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2 int i.n; 

3 FILE * f1— fopen("chap05/SmallestBoundingRectangle/inputdata. txt" ,"r") 5 
4 * f2— fopenC" chap05/SmallestBoundingRectangle/outputdata. txt" ," w") ; 
5 — assert(f18.8-f2); 

6 — fscanfCf1, " d", 8m; 

7 

8 

9 


while(n) { 

Rectangle r; 

Point * q; 
10 assert(q— (Point * )calloc(n,sizeof( Point) )) ; 
11 for(i=0;i<n;i+ +) 
12 fscanf(f1,"%lf 961t" , & Ca[i]. x) , &Cq[i]. y)); 
13 r= smallestBoundingRectangle(q. n) ; 
14 free(q); 
15 ÍprintfCf2, " 5. 4f\n",r. width * r height) ; 
16 fscanfCf1, " 6d" ,&n); 
M. 


18  fcloseCf1) ;fcloseCf2) ; 
19 return 0; 
20 } 


#2 FF 5-22 ”解决 Smallest Bounding Rectangle 问题 的 C 程序 


函数 中 第 7 一 17 行 的 while 循环 处 理 输入 文件 中 的 每 一 个 案例 。 其 中 ,第 10 一 12 行 逐 
一 将 本 案例 中 各 点 坐标 读 人 到 数组 q 中 ,第 13 行 调用 程序 5-21 定义 的 函数 
smallestBoundingRectangle 计算 覆盖 点 集 q 的 面积 最 小 的 矩形 r。 第 15 行 和 第 16 行将 最 
小 矩形 的 面积 写 人 输出 文件 中 。 

程序 5-22 存储 在 文件 夹 chap05/Smallest Bounding Rectangle 中 的 源 文件 Smallest- 
BoundingRectangle. c 中 ,读者 可 打开 文件 研读 并 试 运行 。 


5.5.3 人 德 克 萨 斯 一 日 游 


Texas Trip 


Description 

After a day trip with his friend Dick. Harry noticed a strange pattern of tiny holes in 
the door of his SUV. The local American Tire store sells fiberglass patching material only 
in square sheets. What is the smallest patch that Harry needs to fix his door? 

Assume that the holes are points on the integer lattice in the plane. Your job is to find 
the area of the smallest square that will cover all the holes. 

Input 

The first line of input contains a single integer T expressed in decimal with no leading 
zeroes.denoting the number of test cases to follow. The subsequent lines of input describe 


the test cases. 
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Each test case begins with a single line. containing a single integer n expressed in 
decimal with no leading zeroes, the number of points to follow; each of the following n 
lines contains two integers r and y. both expressed in decimal with no leading zeroes. 
giving the coordinates of one of your points. 

You are guaranteed that T<30 and that no data set contains more than 30 points. All 
points in each data set will be no more than 500 units away from (0.0). 

Output 

Print.on a single line with two decimal places of precision. the area of the smallest 
square containing all of your points. An answer will be accepted if it lies within 0. 01 of the 
correct answer. 


Sample Input 


2 


= 
I—1 
11 
=r 
4 

10 1 
10—1 
-i 
—19—1 


Sample Output 


4.00 
242. 00 


l. 问题 描述 与 分 析 


Dick 开 着 Harry 的 SUV 到 德 克 萨 斯 州 一 日 游 。 回 来 后 , Harry 发 现 车 门 上 有 一 些 由 
分 布 细小 的 点 构成 的 损伤 。 他 准备 到 汽 修 店 去 购买 正方 形 的 玻璃 胶 贴 在 损伤 处 ,希望 找到 
能 覆盖 这 些小 点 的 最 小 正方 形 。 此 问题 的 形式 化 表述 如 下 。 

输入 : 点 集 Q={ (ay ey) (tee ye) ott Gn y). 

输出 : 覆盖 Q 的 最 小 正方 形 的 面积 。 

解决 这 个 问题 可 以 利用 上 一 题 的 结果 , 先 找 到 覆盖 Q I d EE RR BARBIE 


$8 x 
方形 , 则 返回 R 的 面积 : 若 否 , 则 计算 覆盖 R 的 最 小 正 | | IN 
方形 S 的 面积 。 设 R 的 高 与 宽 分 别 为 h Al w RAR 
般 性 ,假定 也 二 hh。 根据 正 方形 和 和 矩形 的 对 称 性 ,外 接 于 h 
尺 的 最 小 正方 形 S 只 能 是 图 5-16 所 示 的 两 种 情形 w D 
让 二。 (a) (b) 


显然 ,情形 5-16(a) 中 正方 形 S 的 面积 为 zwz。 对 A516 外 接 于 R 的 最 小 正方 形 
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于 情形 图 5-16(b) ,R 的 角 将 正方 形 的 每 条 边 分 成 两 段 mwx 和 nn。 其 中 ,2m? =w 228 =? Bl 
m—w/A2 ,n 二 h/WY2。 此 时 ,正方 形 S 的 面积 为 (m 十 n)? 二 (w 十 h)?/2。 

(w+h)?/2<w & Go +h)? < Zw ew +h s d2weh < 2 — Dw 
B24 h> Q/2 — 1) w 时 ( 见 图 5-16 (a)), 覆 盖 R 的 最 小 正方 形 S 的 面积 是 w?; 当 过 
(2 一 1)w lE CLE 5-16(b)),S 的 面积 为 (w 十 h)?/2。 


2. 算法 描述 


在 本 问题 的 算法 中 要 调用 上 一 题 的 SMALLEST-BOUNDING-RECTANGLE 过 程 ,需要 对 
它 做 少许 修改 ,返回 的 不 是 覆盖 点 集 Q 的 最 小 矩形 R 的 面积 ,而 是 该 矩形 R 的 高 h 与 宽 
wlh<w). 


TEXAS-TRIP(Q) 

1 R «-SMALLEST-BOUNDING-RECTANGLE(Q) 
2 if R[A]2 (2— D * RLw] 

3 then return (RL w])* 

4 else return (RL w)]+R[h])?/2 


算法 5-10 ”计算 覆盖 点 集 最 小 正方 形 的 过 程 
3. 程序 实现 


利用 上 一 个 问题 中 程序 5-21 定义 的 函数 smallestBoundingRectangle, 很 容易 用 C 语言 
解决 TexasTrip 问题 。 


1 int main(){ 

2 int i.j.n,m; 

3 FILE * f1=fopen("chap05/TexasTrip/inputdata. txt" ,"r") , 
4 * {2=fopen("chap05/TexasTrip/outputdata. txt" ,"w"); 
5 — assert(f186.8.[2) ; 

6 — fscanf(f1,"%d",&-m); 
7  for(i-0;i-m;id- 4l 

8 double w,h,squaroot2=sqrt(2. 0); 
9 Rectangle r; 


10 Point * q; 

11 fscanf(f1,"% d", &-n); 

12 assert(q= (Point * )calloc(n,sizeof(Point))) ; 
13 for(j=0;j<n;j++) 

14 fscanf(fl,"%lf 261f" , &Cq[3]. x), & Cali]. y : 
15 r=smallestBoundingRectangle(q,n) ; 

16 free(q) ; 

17 w=r. height>r. width? r. height:r. width; 

18 h=r. height+r. width— w; 

19 if( h>(squaroot2—1) * w) 

20 ÍprintfCf2, " 95. 4Nn" w * w); 
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21 else 

22 ÍprintfCf2, " 4. 4f\n",(w+h) * Cw-- 0/2 ; 
23 ) 

24  fcloseCf) ; fclose( f2) ; 

25 return 0; 

26 } 


程序 5-23 ”解决 TexasTrip 问题 的 C 程序 


程序 中 第 6 行 从 输入 文件 中 读 取 案例 数 m。 第 7 一 23 行 的 for 循环 处 理 输入 文件 中 的 
每 一 个 案例 。 其 中 ,第 11 行 读 取 本 案例 的 点 数 n, 第 12 一 14 行 从 输入 文件 中 读 取 本 案例 的 
n 个 点 的 坐标 存储 到 数组 qd 中。 第 15 行 调用 函数 smallestBoundingRectangle, 完成 算 
法 5-10 的 第 1 行 操作 ,计算 覆盖 点 集 q 的 最 小 矩形 r。 第 17 行 和 第 18 行 根据 r 的 宽度 和 
高 度 确定 w 和 上 Aw hb). 58 19 一 22 行 的 if-else 语句 完成 算法 5-10 中 第 2 一 4 行 的 操 
作 , 将 计算 结果 写 人 输出 文件 中 。 

程序 5-23 存储 在 文件 夹 chap05/TexasTrip 中 的 源 文件 TexasTrip. c 中 ,读者 可 打开 
文件 研读 并 试 运行 。 
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信息 技术 广泛 深入 的 应 用 ,对 信息 的 安全 要 求 日 益 提 高 。 信 息 安 全 最 基本 的 技术 是 密 
码 技术 ,基于 大 素数 的 密码 技术 将 一 度 被 视 为 一 个 纯 数 学 课题 的 数论 扒 到 了 信息 技术 应 用 
的 前 沿 。 基 于 大 素数 的 密码 方案 的 可 行 性 依赖 于 能 快速 找到 一 个 大 素数 的 能 力 , 而 它们 的 
安全 性 则 依赖 于 对 大 整数 的 素 因 数 分 解 的 无 奈 。 本 章 介绍 作为 这 些 应 用 的 基础 一 些 数论 理 
论 和 相关 的 算法 。 


6.1 整数 的 表示 


6.1.1 整数 的 表示 


Wt B 为 一 正 整数 (B 二 1) ,对 任 一 正 整 数 a, 在 B 进 制 下 可 唯一 地 表示 为 


a= J aB, 0xa « Ba, #0 (6-1) 


i=0 


称 a 为 n 十 1 位 的 (B 进 制 ) 正 整数 ,a; 称 为 a 的 第 i 位 数字 ,i 二 0, 1. n n。 例 如 , 当 B=10 
时 ,就 是 人 们 最 熟悉 的 十 进 制 整数 ,而 当 B=2 时 ,就 是 在 计算 机 中 表示 的 二 进 制 整数 。 显 
然 B 越 大 ,相同 的 位 数 可 表示 的 数 就 越 大 。 在 计算 机 中 ,通常 使 用 的 整 型 数据 要 受 处 理 器 
的 字 长 限制 。 一 个 字 长 为 32 位 的 二 进 制 整 型 数据 的 取 值 范围 为 一 22 一 22 一 1, 即 
一 2 147 483 648—2 147 483 647。 若 应 用 中 需要 更 大 的 取 值 范围 ,例如 要 对 一 2 一 2 一 1 
范围 内 的 数据 进行 计算 处 理 , 则 需要 定义 更 大 的 整数 数据 类 型 。 

在 定 字 长 计算 机 中 表示 长 整数 的 方法 往往 是 将 正 整数 的 各 位 数字 顺序 表示 成 一 个 线性 
表 。 我 们 约定 , 按 从 低位 到 高 位 顺序 存储 。 一 般 的 整数 a 表示 为 具有 表示 其 绝对 值 的 线性 
K value[a] (as, a，…， a,) 及 表示 正 负 符号 属性 signLaj 的 对 象 。 整 数 的 算术 运算 均 以 
绝对 值 的 计算 为 基础 ,所 以 本 章 主要 讨论 非 负 整数 的 运算 。 按 上 述 约定 ,在 后 面 的 介绍 中 一 
^r B 进 制 正 整 数 a 直接 表示 成 (a,a,_1*…aiao)。 


6.1.2 整数 的 算术 运算 


1. 加 法 


正 整 数 4= 二 (aras-1…aiao) ,0 二 (bmam-1…bibo) ,它们 的 和 a 十 6 d c Ceci toc). 
其 中 ,max(n, m)<t<max(n, m) l.c; 是 a 与 5 的 第 i 位 数字 a; 与 5; 的 和 加 上 低位 (第 
i 一 1 位 ) 的 数字 和 对 本 位 的 进位 除 以 B 的 余数 。 写 成 伪 代 码 过 程 为 


ADD(a, b) 


数论 算法 


1 carry<-0 

2 t<min(m, n) 

3 for i<-0 to t > 从 低位 到 高 位 逐 位 计算 
4  doc;-a;b; carry 

5 carry% c;/B 

6 c;*- c; mod B 

7 for i<-t+1 ton DX n>m 的 情形 
8  doci- a; carry 

9 carry< c;/ B 

10 ci c; mod B 

11 for i<-t+1 tom DX} m>n HITT 
12 doc; bitcarry 

13 carry“ ci/B 

14 c;*- c; mod B 

15 if carry 天 0 

16 then c;<-carry 

17 return c 


算法 6-1 计算 B 进 制 正 整数 a 与 5 的 和 的 过 程 


过 程 ADD 运行 如 下 。 第 3 一 6 行 的 for 循环 对 a 与 5 从 低位 到 高 位 逐 位 进行 加 法 计算 ， 


若 将 ab 的 较 大 位 数 记 为 ,不 难看 出 ADD 过 程 的 运行 时 间 是 OC), 
2. 减法 


其 中 第 4 行 计算 本 位 数 a; 与 5; 的 和 并 加 入 上 一 位 数字 和 对 本 位 的 进位 carry 。carry 在 第 
1 行 初 始 化 为 0, 这 是 因为 刚 开始 对 最 低位 计算 和 时 ,没有 前 一 位 的 进位 。 第 5 行 计算 本 位 
对 下 一 位 的 进位 ,记录 在 carry 中 ,第 6 行 完 成 和 的 本 位 值 c 的 计算 。 对 ab 的 位 数 不 同 的 情 
形 , 需 要 对 较 长 的 部 分 做 处 理 : 每 一 位 要 与 前 一 位 的 进位 相 加 。 这 由 第 7 一 10 行 及 第 11 一 
14 行 的 for 循环 完成 。 第 15 一 16 行 根据 最 高 位 是 否 有 进位 决定 数位 是 否 有 增加 。 


ik BEM IE SEE a= (aa, 227A, dy) b= (bpm) 7D by) a >b., a 5j b 32$ a—b 记 为 c= 


SuB(a, b) Dit a 一 5, 假 定 ab 
1 for i<-0 to m 

2  doci--a;—b 

3 if c; 0 

4 then c; 4-6; +B 

5 [i ai+l 一 1 

6 for i--m3-1 to n 

7 doc-a, 

8 if c; 0 

9 then c;c; +B 

10 Gti ati — 1l 
11 消去 < 的 高 位 0 


(cci Co) o FEAR .OSt<n, M a; 2b; WE «c; =a; — 5, 3 M M a; <b; WE «c; =a; — 5; + B. WEISE aiti 
减 小 1。 写成 伪 代 码 过 程 如 下 。 
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12 return c 
算法 6-2 HH BEHER a .2 的 差 过 程 


很 明显 ,算法 中 第 1 一 5 行 的 for 循环 重复 mm 次 .而 第 6 一 10 行 的 for 循环 重复 n 一 m 次 , 故 
算法 的 运行 时 间 为 960. 


3. 乘法 
为 说 明 长 整数 的 乘法 , 先 来 看 下 面 的 两 个 十 进 制 整数 相 乘 的 * 竖 式 ”。 
2. E 2 <8 
X c» 3 
9 $7.2 
3 12 4 
406 1 
+ 6 2 4 8 
6 6 5 4 E 2 


其 中 a= (25a2a1a9) — (3124) b= (heb bo ) = (213) ,将 C= CGescscues 2c ) 初 始 化 为 0。 考 
察 第 1 根 横 线 下 的 第 1 行 数据 (9 3 7 2) ,分 别 是 as vaz a vao 与 bo =3 相 乘 对 应 积 与 es sc. 
cs( 均 为 0) 的 和 。 第 2 根 横 线 下 第 1 行 数 据 4 0 6 1, 是 as .az ai sao I3 1 相 乘 对 应 积 (3 1 2 
4) 分 别 与 c .cs c 609 37) 的 和 。 而 第 3 根 横 线 下 的 一 行 数据 (6 6 5 4 1 2) 就 是 积 (csccs 
czclco) 一 c 一 a0。 其 中 ,(6 6 5 4) 是 as .az .al vao 与 b —2 相 乘 对 应 的 积 (6 2 4 8) 与 cs c4 cs C2 
(040 6) 的 和 。 将 此 过 程 写成 伪 代 码 如 下 。 


PRODUCT(a, b) 

1 for i<-0 to m 

2  dorcarry--0 

3 for j<-0 ton 

4 do ciz; 7b X aj. ci+; carry 
5 carry*-c«;/ B 

6 C4; ci; mod B 

7 if carry#0 

8 

9 


then c;+; carry 


算法 6-3 HARNES a.b 的 积 的 过 程 


PRODUCT 过 程 的 第 1 一 8 行 的 for 循环 从 高 位 到 低位 逐 位 按 上 述 讨论 的 方法 计算 积 。 若 
4 都 是 2 二 1 位 也 进 制 数 , 则 过 程 的 运行 时 间 为 OG. 


4. 带 余 除法 


首先 ,不 证 明 地 罗列 自然 数 的 一 个 基本 人 性质 。 
最 小 数 原理 若 M 是 自然 数 集 N 的 任 一 非 空子 集 ( 有 限 或 无 限 均 可 ), 则 M 中 必 有 最 小 
的 数 。 
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我 们 将 会 看 到 ,这 条 关于 自然 数 的 基本 原理 ,是 本 章 所 讨论 的 全 部 理论 的 出 发 点 。 
定理 6-1( 除 法 定理 ) 对 任意 整数 a 和 正 整数 ,存在 唯一 的 整数 g 和 > 使 得 
a=q+r0<r<n (6-2) 

证 明 AUX a 是 自然 数 的 情形 给 出 证 明 , 对 于 a 为 负 整数 的 情况 很 容易 由 自然 数 的 结论 
加 以 推导 。 构 造 集 合 M={q' EN: gn 宇 a}SN, 根 据 自然 数 的 最 小 数 原理 知 ,M 中 有 一 个 最 小 
数 doin o 

D FF quina 5 W q= qus ,7 二 0 即 为 唯一 满足 本 定理 中 条 件 的 g 和 7。 

(2) E qui n27a BC q— qu, — 1. ra—qn. WA gn<a, 且 0<r=a 一 (qs 一 Dn 二 a 一 qiin n 
+n=n— (qu, n—a)-n, ilii qud-r— qn 十 (a 一 qn) 二 a。 由 自然 数 的 算术 运算 的 唯一 性 知 ,此 g 
和 7 是 唯一 存在 的 。 

合并 (1) 和 (2) 就 得 到 了 本 定理 的 证 明 。 

对 给 定 的 整数 a 和 正 整 数 , 计 算 定 理 6-1 中 值 g 和 的 运算 就 是 人 们 所 熟悉 的 整数 的 除 
法 a/n。 把 值 g 称 为 a 除 以 的 商 , 记 为 la/n 上 值 > BON a 除 以 的 余数 或 a 关于 模 n 的 余 
数 , 记 为 a mod n。 当 a BREL n 的 余数 a mod n=0 时 我 们 称 n BR a. 

以 十 进 制 数 为 例 ,考察 整数 的 除法 算法 。 先 考虑 除数 为 1 位 数 的 正 整 数 除法 ,例如 ,a 二 
(aaaiao) 一 327,0 一 (加 ) 一 2, 计 算 a/b 的 竖 式 如 下 。 

6 3 


式 中 商 q=163。 若 将 余数 ~ 初始 化 为 0,q —1—3/2— GB-- ai /b) ,此 时 > 一 (CrB 十 az) 
mod & —3 mod 2—1. rB 十 a —1X 10-2 —12 恰 为 第 1 RRA FAM. q =6=12/2= 
GB--a; ) /b, ,此 时 r=(rB+a,) mod b, —12 mod 2—0.rB--a, —0X 104-7 —7 恰 为 第 2 根 横 线 
FRR. go =3=7/2= (B+ ao)/bys HAY r=(rB+a.) mod & —7 mod 2 二 1。 如 此 ,g= 
(ddd)。 将 此 过 程 写成 伪 代 码 如 下 。 


DIVIDED-BY-DIGIT(a, b) DBR b J& 1 位 正 整数 
1r-0 

2 for j--n downto 0 

3 dog (rB+a;)/b] 

4 r<—(rB+a;) mod b 

5 return q and r 


算法 6-4 计算 B 进 制 正 整数 a 除 以 1 位 B 进 制 正 整数 5 的 过 程 


显然 ,过 程 的 运行 时 间 是 O. Hp sn 是 a 的 位 数 。 
下 面 考虑 除数 是 多 位 数 的 情况 。 设 a 二 327.5 二 23, 则 a.b 相 除 的 竖 式 如 下 。 
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2.8) 920 


to 
o ww Ne 


2 
5 


在 上 式 中 ,a 二 (azalao) 二 (327) .b= (bibo) = (23). R q=a/b 的 位 数 至 多 为 n 一 mm 十 1 二 
2 一 1 十 1 二 2。 而 余数 r= 二 a mod b 的 位 数 至 多 为 m= 二 2。 与 除数 5 为 1 位 数 的 情形 相仿 ,将 中 间 
余数 7 初始 化 为 3=a;, 令 q =1=32/23= (r * 10+a1)/b, JERY, (rx*10 二 a) mod 0 一 32 mod 
23 二 9, 今 其 为 新 的 +。 接 下 来 令 qo =4=97/23=(r * 10 十 ao)/6b。 此 时 , (r * 10 十 ao) mod b= 
97 mod 23 二 5, 邻 其 为 新 的 r-。 则 g 二 (qigo) 二 14, 即 为 商 a/5, 而 r= 二 5 BIOS a 除 以 5 的 余数 。 一 
般 地 ,对 于 2 十 1 EIE SEA a = (aa, aia mod PETE R R = nba- bibo), WITH 
式 (6-2) 中 的 g A r Ki r DREH Cananiani) 7 从 7 一 天 起 到 0 为 止 , 依 次 计算 q; = 
(r。B 十 waw)/, 重 置 r=(r * B+a;) mod OCB BE r— Gr * B--aj) —q; * D. W G=Cu-mQn—m—1°** 
aoM r 即 为 所 求 。 需 要 注意 的 是 此 处 5 不 是 1 HIC I AE m--1 位 数 。 计 算 q;— C * B+ 
aj)/b,j=n—m, n 一 m 一 1,，…,0 是 除法 中 的 “智慧 ”所 在 。 最 直接 的 方法 是 从 0 到 B 一 1 逐一 
检测 ,直至 0 三 (r*，B 二 aj) 一 g;* bb, “4 B 较 大 时 ,这 是 比较 费时 的 。 下 列 引 理 使 得 我 们 能 
尽快 地 找到 合适 的 g;。 注 意 (r*， B+a ) 最 多 比 5 多 1 位 。 

引 理 6-1 B 进 制 正 整数 a .6 都 是 n AE a>b. $ bı >lB/2 W q—a bass 

引 理 6-2. 设 妃 进 制 正 整 数 w 王 (as…aiao),0 一 (0 pp 思 pb),a 二 上 且 (a a aia) <b, 


id min (HE pi) , 若 和 ->LB/2 Lil a/b=4 ad 71a. 


引 理 6-1 和 引 理 6-2 告诉 我 们 ,在 至 多 比 多 ER bı mE B/2 的 前 提 条 件 下 , 即 
至 多 做 3 次 试 商 即 可 得 到 商 q=la/b J. 而 条 件 o, LB/2 苛 以 通过 除法 前 和 2 同时 乘 
D d =LB/ Cbn- +1) 策 得 以 保证 (这 一 操作 称 为 “规格 化 ”) ,除法 后 ,将 ~ 除 以 d( 去 规格 化 ) 
而 得 。 

DIVISIONCa 6) DIt n+l 位 及 mm 十 1 位 正 整 数 a,b 计 算式 (6-2) 中 的 g 和 rr 


1 if a<b 
2 then q-—0, ra 


3 return g and r 

4ifa=b 

5 then g<1 

6 reco 

7 return q and r 

8 if ba <B/2 Di BUE EB T d 
9 then d<1B/(,, +1) ] 

10 else d< 1 

11 u*-da, v--db, n+ u 的 位 数 一 1, m<v 的 位 数 一 1 > 规格 化 
12 re (uu, ui 

13 for j*-1— m downto 0 

14 doif r<v 
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15 then g;<-0 

16 else if r 的 位 数 一 " 的 位 数 

17 then q; —r,. /vn 

18 else g;<-min(L(u;B+u;-1)/v» |, B-10—2 
19 r*- r—Qjv 

20 while r>v 

21 do r—r—v 

22 g- qj 

23 r*-rB-a; 

24 r«-r/d 上 > 去 规格 化 
25 去 除 q 的 高 位 0 


26 return q and r 
算法 6-5 计算 B 进 制 正 整 数 a 除 以 2 的 商 与 余数 的 过 程 


算法 DIVISION 的 第 1 一 3 行 处 理 a<b 的 情形 ,此 时 g=0,r=a。 第 4~7 行 处 理 a=b 
的 情形 ,此 时 g=1,r=0。 第 8 一 10 行 计算 规格 化 因子 。 第 11 行 对 aod 作 规格 化 操作 。 第 
12 行 初始 化 中 间 余 数 +。 第 13 一 23 行 的 for 循环 从 高 位 到 低位 逐 位 计算 商 。 其 中 ,第 14 一 
18 行 针对 3 种 不 同 的 情形 一 ” 生 wsr>>v 且 ~ 的 位 数 相等 及 比 v 多 1 位 一 一 初始 化 商 
的 第 j 位 gq;。 第 19 行 计算 中 间 余 数 7 与 gjv 的 差 ,第 20 一 22 行 的 while 循环 确定 g;。 根 据 
引 理 6-1 和 引 理 6-2 知 ,该 循环 至 多 重复 3 次 。 第 23 行 计算 新 的 中 间 余 数 +。 完 成 上 面 的 
计算 后 ,第 24 行 执行 去 规格 化 操作 。 第 25 行 去 除 q 中 可 能 的 高 位 0。 

X n=2m 时 ,第 13 一 23 行 的 for 循环 重复 次 ,循环 体 中 第 19 行 的 运算 耗 时 OG), 
故 DIVISION 的 运行 时 间 为 Om). 


6.1.3 程序 实现 


1. 大 整数 的 数据 类 型 定义 及 常规 维护 

本 章 开 发 一 个 基数 为 10" 的 大 整数 类 型 。 由 于 在 整数 的 运算 过 程 中 所 得 到 的 结果 位 数 
是 不 能 事先 预见 的 ,所 以 用 一 个 链表 来 存储 长 整数 的 各 位 数字 是 合适 的 。 还 要 用 一 个 整 型 
数据 表示 长 整数 的 符号 ,约定 : 0 表示 正 数 ,1 表示 负数 。 


1 # define Base 1000000000 /* 大 整数 的 基数 * / 

2 typedef struct { 

3 LinkedList * value; /< 从 低位 到 高 位 存储 大 整数 的 绝对 值 / 
4 — int signs /* 大 整数 符号 : 0 为 正 ,1 为 负 x/ 

5 }BigInt; 


6 BigInt newIntBystring(char * s){ /x 用 表示 大 整数 的 串 创建 大 整数 */ 


7 int n.i; 


8 long x; 
9 div t qr; /*C 语 言 整 除 类 型 数据 quot 属性 表示 商 ,rem 属性 表示 余数 * / 
10 BigInt a; 


11 char digit[10]; 
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12 a, value=createList(sizeof(long) , NULL) ; 


13 ifs[0]-—'—»( /* 创建 一 个 负 的 大 整数 * / 

14 a. sign=1; 

15 sti /* 掠 过 负 号 * / 

16 }else /* 正 整数 * / 

17 a. sign—0; 

18  n-strlen(s); /* 十 进 制 位 数 * / 

19 qr=div(n,9); / * 4% 9 位 十 进 制 数字 构 成 一 位 Base 进 制 数字 * / 
20 if(qr. rem) ( / * Base 进 制 最 高 位 含 十 进 制 数字 位 数 rem * / 
21 strncpy(digit,s,qr. rem) ; /* 读 取 最 高 rem 位 * / 

22 x=strtoul(digit, NULL ,10); /* 转换 成 十 进 制 整数 * / 

23 listPushFront(a. value, 8-x) ; /* 置 为 Base 进 制 最 高 位 * / 

24 ) 

25  for(i—0;i- qr. quot;i 二 十 ){ / * 对 quot 位 Base 进 制 数字 逐 位 处 理 * / 

26 strncpy(digit,s 十 qr. rem 十 ix* 9,9); / * BERR 9 位 十 进 制 数字 * / 

27 x 一 strtoul(digit,NULL,10)， /* 转换 成 整数 * / 

28 listPushFront(a. value, 8x) ; /* 置 为 Base 进 制 当前 最 低位 * / 

29 } 

30 return a; 

31) 

32 void printInt(BigInt * a){ /* 屏 幕 输出 大 整数 (Base 进 制 ) * / 


33  ListNode * p; 
34  if(list&Empty(a-»value)) 


35 return; 

36  if(a-»sign) /< 负数 * / 

37 printf("—"); 

38  p—a-»value-»nil-» prev; / * Base 进 制 最 高 位 / 


39 printf("%lu", * ((long* )(p->key))); 
40 p=p->prev; 


41  while(p! —a-»value-»niD ( /* 自 高 向 低 逐 位 输出 * / 
42 printf("%09lu", * ((long* )(p->key))); 

43 p=p->prev; 

44 } 

45 } 


程序 6-1 大 整数 类 型 定义 及 常规 维护 函数 


对 程序 6-1 的 说 明 如 下 。 

(1) 第 1 行 定义 了 一 个 值 为 10 的 宏 Base, 表 示 长 整数 的 基数 。 第 2 一 5 行将 长 整数 类 
型 定义 成 结构 体 BigInt, 它 具有 两 个 属性 : 表示 绝对 值 的 链表 (程序 2-1 中 定义 的 
LinkedList 类 型 )value 和 表示 符号 的 整数 sign。 

(2) 第 6 一 31 行 定 义 的 函数 newIntBystring 用 传递 给 它 的 表示 十 进 制 长 整数 的 字符 串 
s 创建 并 返回 一 个 BigInt 对 象 。s 里 面 存储 的 是 诸如 “12345” 或 “一 12345” 这 样 的 表示 整数 
的 字符 串 。 函 数 的 设计 思想 并 不 困难 : 以 下 例 说 明 。 对 表示 十 进 制 长 整数 的 串 

“31284763 285792454 284512541 876491874 291631524" 
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创建 一 个 基数 Base 为 10? 的 长 整数 ,首先 调用 库 函 数 div 将 串 的 长 度 n=44 除 以 9, 商 4 余 
8。 这 意味 着 将 其 转换 成 基数 为 10 的 长 整数 有 5 位 (用 空格 隔 开 ) , 除 最 高 位 为 十 进 制 8 位 
数 外 ,其 余 4 位 为 9 位 十 进 制 数 。 

接 下 来 对 s 从 头 开 始 调用 库 函 数 strncpy 截取 长 度 为 8 的 子 串 ,调用 库 函 数 strtoul 将 
其 转换 成 整数 ,作为 长 整数 的 最 高 位 数字 。 然 后 循环 4 次 每 次 从 串 的 当前 位 置 开 始 截 取 长 
REH 9 的 子 串 ,转换 成 整数 ,调用 程序 2-4 中 定义 的 函数 listPushFront 将 此 整数 插入 到 链 
K value 中 , 自 高 向 低地 置 为 长 整数 的 各 位 数字 。 

G) 第 32 一 45 行 定义 的 函数 printInt 将 在 屏幕 当前 位 置 输出 传递 给 它 的 参数 a 所 指引 
的 长 整数 。 由 于 长 整数 的 各 位 数字 是 按 自 低 向 高 的 顺序 存储 在 链表 value 中 。 所 以 ,程序 
是 自 链 表 的 尾 结 点 开始 依次 输出 a 的 绝对 值 的 各 位 数字 。 打 印 每 一 位 10" 进 制 的 数字 ,需要 
输出 9 位 十 进 制 数 ,为 了 对 不 足 9 位 的 数 也 能 正确 输出 ,要 用 格式 符 "%09d” 来 对 高 位 空白 
填 0。 

此 外 ,第 19 行 调用 的 库 函 数 div 的 原型 声明 为 


div. t divC int numerator, int denominator ) ; 


该 函数 计算 参数 numerator 除 以 参数 denominator 的 商 quo 和 余数 rem, quo 和 rem 整合 
为 系统 定义 的 结构 提 类 型 div_t 的 两 个 成 员 属 性 。 
第 21 行 和 第 26 行 调用 的 库 函 数 strncpy 的 原型 声明 为 


char * strncpy( char * to, const char * from, size t count ); 


该 函数 将 参数 from 指引 串 中 由 参数 count 确定 的 长 度 的 子 串 复制 到 由 参数 to 指引 的 
qup; 
第 22 行 和 27 行 调用 的 函数 strtoul 的 原型 声明 为 


unsigned long strtoul( const char * start, char * * end, int base ); 


该 函数 将 由 参数 start 指引 的 串 中 按 参 数 base 表示 的 进位 制 整数 的 串 转换 成 长 整 型 数据 返 
回 。 其 中 参数 end 将 指出 start 中 表示 整数 数据 的 子 串 的 末尾 。 若 应 用 中 无 须 此 信息 ,可 传 
递 NULL, 如 在 此 处 的 用 法 。 

函数 div 及 strtoul 的 原型 声明 于 头 文件 stdlib. h 中 ,strncpy 的 原型 声明 于 头 文件 
string.h 中 。 


2. 大 整数 的 算术 运算 


长 整数 的 算术 运算 的 基础 操作 是 针对 绝对 值 的 , 即 针对 正 整 数 的 。 算 法 6-1 一 算法 6-5 
都 是 针对 正 整 数 设计 的 。 对 一 般 的 大 整数 的 算术 运算 ,根据 整数 运算 的 代数 法 则 ( 符 
号 法 则 ) ,调用 该 算法 即 可 求 得 。 限 于 篇 幅 , 仅 列 出 大 整数 加 法 的 C 语言 实现 代码 并 加 
以 解析 。 

1) 正 整 数 的 加 法 

首先 实现 计算 正 整数 加 法 的 算法 ADD。 


1 LinkedList * valueAdd(LinkedList * a, LinkedList * b){ 
2 LinkedList * x, * y, * z=createList(sizeof(long) , NULL) ; 
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3 ListNode * p. * q; 

4 long r,carry=0; 

5 if(a->n>=b->n){ /*x 为 a、b 中 较 高 位 者 * / 

6 x=asy=b; 

7 }else{ 

8 x=bsy=a; 

9 } 

10 p—x-»nil-»next;q— y-»nil-»next; — /* p,q 分 别 指 向 x、y 的 最 低位 */ 
11 while(q! — y-»niD ( 


12 r= * ((long * )(p->key)) + * CClong * )(q->key)) +carry; 
13 carry— r/ Base; / * 向 高 位 的 进位 */ 

14 r=r% Base; /* 本 位 和 x*/ 

15 listPushBack(z, &-r) ; /* 插 入 和 的 当前 位 */ 
16 P= p->next;q=q->next; 

17 ) 

18 — while(p! = x->nil) ( /*x 还 有 高 位 未 完成 运算 */ 
19 r= * ((long * )(p->key)) 十 carry; 

20 carry— r/Base; 

21 r=r% Base; 

22 listPushBack(z, &-r) ; 

23 p=p->next; 

24 } 

25 if(carry) /* 向 最 高 位 有 进位 x*/ 
26 listPushBack(z, &.carry); 

27 return z; 

28 } 


BF 6-2 实现 算法 6-1 ADD 过 程 计 算 两 个 正 整 数 加 法 的 C 函数 


对 程序 6-2 的 说 明 如 下 。 

CD 函数 valueAdd 实现 算法 6-1 的 ADD 过 程 . 对 由 指针 参数 a、b 指引 的 表示 成 链表 的 
大 整数 绝对 值 进行 加 法 运算 ,返回 表示 成 链表 的 和 。 

(2) 函数 在 第 2 行 设置 3 个 链表 指针 x yz. x y 分 别 指向 a b 中 较 长 者 和 较 短 者 。z 
指向 a.b 的 和 。 第 3 行 设置 了 2 个 链表 结 点 指针 p、q, 分 别 指向 xy 的 当前 结 点 , 即 两 个 正 
整数 的 当前 位 。 第 4 行 设 置 的 long 型 变量 r 和 carry 分 别 用 来 表示 每 一 位 的 和 及 向 高 位 的 
进位 值 。carry 初始 化 为 0。 

(3) 第 5 一 9 行 的 if-else 结构 完成 x. y 的 正确 指向 (x 指向 a、b 中 较 长 者 ,y 指向 较 短 
者 )。 第 10 行将 p.q 分 别 初始 化 为 xy 的 最 低位 指针 。 第 11 一 17 的 while 循环 实现 算法 
6-1 中 第 3 一 6 行 的 for 循环 ,从 个 位 开始 计算 较 低位 的 和 。 第 18 一 24 行 的 while 循环 实现 
算法 中 第 7 一 10 行 和 第 11 一 14 行 的 for 循环 ,完成 对 较 高 位 的 和 的 计算 。 第 25 行 和 第 26 
行 的 证 语句 ,实现 算法 中 的 第 15 行 和 第 16 行 的 if-then 结构 。 对 和 的 最 高 位 进行 处 理 。 

注意 ,在 处 理 过 程 中 ,向 表示 和 的 z 插 入 每 一 位 的 操作 ,都 是 调用 程序 2-4 中 定义 的 函 
数 listPushBack 完成 的 。 这 是 因为 ,曾经 约定 长 整数 的 绝对 值 是 按 从 低位 到 高 位 的 顺序 存 
储 的 。 
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a=b. 


^il 


2) 正 整 数 的 减法 
下 面 来 实现 计算 正 整 数 减法 的 算法 SUB。 


1 LinkedList» valueSub(LinkedList * a, LinkedList * b){ 


2 
3 
4 
5 
6 
7 
8 
9 


10 


31} 


LinkedList * x=listClone(a), * y=b, * z=createList(sizeof(long), NULL); 
ListNode * p— x-»nil-»next. * q= y-»nil-»next; 
long r; 
while(q! =b->nil) { 
r= * ((long * )(p->key)) — * ((long * )(q->key)) ; 
p=p->next;q=q->next; 
if(r<0) { 
r+=Base; 
( * (Clong * )(p-5key))) —— ; 
) 
listPushBack(z, &-r) ; 
) 
while(p! = x-»niD { 
r= * ((long * )(p->key)); 
p-—p-»next; 
if(r<0) ( 
r+= Base; 
* (long * )(p-^key) ——; 
) 
listPushBack(z, &-r) ; 
} 
p=z->nil->prev; 
while(p! —z-»nil-»next8-&. * ((long * )(p-»key)) ==0) { 
listDelete(z, p) ; 
p=z->nil—>prev; 
} 
clrList(x, NULL) ; 
free(x) ; 
return z; 


程序 6-3 ”实现 算法 6-2 SUB 过 程 计算 两 个 正 整数 减法 的 C 函数 


对 程序 6-3 的 说 明 如 下 。 
(1) 函数 valueSub 实现 算法 6-2 的 SUB 过 程 ,对 由 指针 参数 a、b 指引 的 表示 成 链表 的 
大 整数 绝对 值 进行 减法 运算 ,返回 表示 成 链表 的 差 。 此 处 ,假定 传递 进来 的 两 个 大 整 


(2) 函数 在 第 2 行 设置 3 个 链表 指针 x、y、z。 由 于 在 数 的 减法 过 程 中 ,被 减 数 的 某 一 位 
可 能 要 借 位 给 低位 ,而 改变 被 减 数 原来 的 值 ,所 以 需要 将 被 减 数 a 复制 到 x 中 。y 直接 指向 
b。z 指向 a.b 的 差 。 第 3 行 设置 了 2 个 链表 结 点 指针 p、q, 分 别 指向 xy 的 当前 结 点 , 即 两 


E 整 数 的 当前 位 ,初始 化 为 xy 的 最 低位 指针 。 第 4 行 设 置 的 long 型 变量 r 用 来 表示 每 
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一 位 的 差 。 


(3) 


第 5 一 13 行 的 while 循环 实现 算法 6-2 中 第 1 一 5 行 的 for 循环 ,从 个 位 开始 计算 较 


低位 的 差 。 第 14 一 22 行 的 while 循环 实现 算法 中 第 6 一 10 行 的 for 循环 ,完成 对 较 高 位 的 
差 的 计算 。 由 于 两 个 整数 相 减 可 能 造成 高 位 置 0, 第 23 一 27 行 实现 算法 中 的 第 11 行 操作 ， 
消除 差 的 高 位 0。 

3) 正 整 数 的 比较 


1 int valueCompare(LinkedList * a, LinkedList * b)( 


2 
3 
4 
5 
6 
7 
8 
9 


10 


ListNode * p—a-»nil-»prev. * q= b-»nil-»prev; 
if(a—>n>b->n) 
return 1; 
if(a->n<b->n) 
return —1; 
while(p! —a-»niD { 
ifC * (Cong * )(p->key)) > * CClong * )(q->key))) 
return 1; 
ifC * (Cong * )(p->key) )< * CClong * )(q-5key))) 
return —1; 
p—p-»previq—q-» prev; 
) 


return 0; 


程序 6-4 大 正 整 数 大 小 比较 函数 


函数 valueCompare 对 由 参数 ab 指引 的 两 个 大 正 整 数 比 较 大 小 。 若 前 者 大 ,返回 1; 
若 两 者 相等 , 则 返回 0; 若 前 者 小 , 则 返回 一 1。 函 数 体 中 的 第 3 行 和 第 4 行 对 应 a 的 位 数 大 于 b 
的 位 数 的 情况 ,第 5 行 和 第 6 行 处 理 相反 情况 。 第 7 一 13 (AERE a,b 位 数 相等 的 情况 ,从 高 
位 到 低位 逐 位 检测 , 遇 到 不 相等 的 情形 ,随即 决定 大 小 。 若 所 有 位 都 相等 ,第 14 行 返回 0。 

4) 大 整数 的 和 

利用 程序 6-2 一 程序 6-4, 下 列 函 数 计算 两 个 大 整数 的 和 。 


1 BigInt sum(BigInt a. BigInt b){ 


2 
3 
4 
5 
6 
7 
8 
9 


10 
11 
12 
13 
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BigInt c; /* a,b AYA * / 
int comp— valueCompare(a. value,b. value); —/ * a,b 的 绝对 值 比较 */ 
if(a. sign= =b. sign) { /*a,b 符号 相同 * / 


c. value 一 valueAdd(a. value, b. value); 
c. sign— a. sign; 
return c; 
} 
if(comp= —0)( / * 符号 相反 ,绝对 值 相同 * / 
long x—0; 
c. value— createList(sizeof( long) , NULL) ; 
listPushBack(c. value, &-x) ; 


c. sign=0; 
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14 return c; 

15 } 

16 if(comp>0){ / * 符号 相反 ,a 的 绝对 值 大 于 b 的 绝对 值 * / 
17 c. value 一 valueSub(a. value, b. value) ; 

18 c. sign=a. sign; 

19 }else{ /* 符 号 相反 ,b 的 绝对 值 大 于 a 的 绝对 值 * / 
20 c. value 一 valueSub(b. value,a. value) ; 

21 c. sign— b. sign; 

22 ) 

23 return c; 

24) 


程序 6-5 计算 两 个 大 整数 和 的 C 函数 


对 程序 6-5 的 说 明 如 下 。 

C1) 函数 sum 计算 由 参数 a、b 表示 的 两 个 大 整数 (可 正 可 负 ) 的 和 并 返回 。 

(2) 函数 中 设置 两 个 变量 ,一 个 是 表示 和 的 BigInt 型 数据 c, 另 一 个 是 表示 a,b 的 绝对 
值 大 小 比较 结果 的 整 型 数据 compare。 第 3 ff compare 初始 化 为 调用 程序 6-4 定义 的 函数 
valueCompare ,比较 ab 的 绝对 值 的 返回 值 。 

(3) 第 4 一 8 行 的 证 语句 检测 ab 符号 相同 的 情形 。 第 9 一 15 行 的 证 语句 检测 ab 反 
号 绝对 值 相等 的 情形 。 第 16 一 22 行 的 if-else 语句 检测 a、b 反 号 绝对 值 不 等 的 情形 。 处 理 
的 原则 是 同 号 绝对 值 相 加 符号 不 变 , 反 号 绝对 值 相 减 符号 按 绝对 值 大 的 设置 。 

为 便于 代码 管理 ,将 程序 6-2 和 程序 6-3 的 函数 原型 声明 于 文件 夹 numbertheory 中 的 
头 文件 valuecalc. h 中 ,函数 定义 于 同一 文件 夹 的 源 文件 valuecalc. c 中 。 为 便于 代码 重用 ， 
程序 6-4 的 函数 原型 声明 于 文件 夹 numbertheory 中 的 头 文件 bigint. h 中 ,而 函数 定义 于 同 
一 文件 中 的 源 文件 bigint. c 中 。 


6.1.4 应 用 


The X Problem 


Describtion 

We are not alone. 

In the year 3000. scientists have eventually found another planet which has intelligent 
being living on. Let's say. Planet X. And we call the intelligent being there “Xmen”. To 
learn advanced technology from Planet X. we want to exchange information with XMen. 
Unfortunately. XMen use a very strange data format when sending message. which is 
called m-encoding (m is for multiplication). Scientists on earth have successfully found out 
the algorithm of m-encoding. defining as following: 

For each data package from XMen. there are two non-negative integers. A and B. 
And the actual data XMen want to send is the product of A and B (A * B). 


So. in this problem. you are to implement a decoder for data packages from XMen. 
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Input 


There are multiple tests. Input data starts with an integer N. indicating the number 


of test cases. 


Each test case occupies just one line. and contains two non-negative integers A and B 


(OSA, B<10'°), separated by just one space. 


Output 
For each test case, output the actual data XMen want to send, one in a line. 


Sample Input 


3 

11 

100 123 
1234578901234567890 54321 


Sample Output 


1 
12300 
67063560493962962352690 


人 类 试图 与 X 星 球 上 的 X 人 通信 。X 人 发 出 来 的 信息 是 经 过 编码 的 : 表示 成 两 个 不 


超过 10”” 的 非 负 整 数 A 和 B, 解 码 需要 将 ALB 相 乘 得 到 积 A XB。 由 于 超过 了 计算 机 系 
统 的 定 长 整 型 数据 的 取 值 范围 ,所 以 需要 用 到 BigInt 类 型 。 程 序 代码 如 下 。 
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1 int mainO( 
2 int n,i; 

3 FILE * fl=fopen("chap06/TheXProblem/inputdata. txt","r")， /* 输 入 文件 * / 
4 * {2=fopen("chap06/TheXProblem/outputdata. txt" ,"w") ;/ * 输出 文件 * / 
5  assertCf18.8.[2) ; 
6 

7 

8 

9 


ÍscanfCf1, "%d", B-n); /* 读 取 案例 数 * / 
for(i—0;i-n;id-4-)( / * 处理 每 个 案例 * / 
char a[1000], b[1000], * s; 
BigInt A, B, C; 
10 fscanf(fl, "%s%s", a, b); / * BER a,b * / 
11 A= newIntBystring(a) ; B= newIntBystring( b) ; /* 生 成 大 整数 A.Bx/ 
12 C= productCA, B); /*C<A* Be / 
13 s=toString( 5C) ; / * ERA / 
14 ÍprintfCf2, " /5sNn" s); /* 写 入 输出 文件 */ 
15 free(s) ; 
16 clrBigIntC & A) ;clrBigIntC 8B) ;clrBigInt( 8-C) ; 
7} 
18 fclose(f1) ; fclose( £2) ; 
19 return 0; 
20] 


程序 6-6 解决 The X Problem 问题 的 C 程序 


第 6 章 数论 算法 


程序 6-6 的 说 明 如 下 。 

COD 第 3 一 5 行 分 别 打开 输入 、 输 出 文件 全 和 {2。 第 6 行 读 取 输入 文件 中 的 测试 案例 
数 n。 

(2) 第 7 一 17 行 的 for 循环 处 理 每 一 个 测试 案例 。 对 每 一 个 案例 ,第 10 行 从 {1 中 读 取 
表示 整数 A.B 的 值 的 a.b。 由 于 A、B 是 大 整数 ,所 以 不 能 直接 表示 成 整 型 数据 ,而 要 通过 
Bab 创建 BigInt 对 象 A 和 B( 第 11 行 )。 第 12 行 调用 计算 大 整数 积 的 函数 product 计算 
AxB, 将 函数 值 ( 积 ) 赋 予 C。 第 13 行 调 用 函数 toString 将 C 的 值 转换 为 串 ,并 赋予 s。 第 
14 行 将 s 作 为 一 行 写 入 {2。 第 16 行 调用 函数 clrBigInt 清理 A, B,C 的 空间 ,以 防 内 存 

G) 第 12 行 调用 的 函数 product 实现 计算 整数 乘法 的 算法 6-3。 第 13 行 调 用 的 函数 
toString 的 定义 类 似 于 程序 6-1 中 定义 的 printInt, 不 过 是 把 对 库 函 数 printf 的 调用 改变 成 
对 库 函 数 sprintf 的 调用 。 第 16 行 调用 的 函数 clrBigInt 负责 清理 由 参数 指引 的 大 整数 的 存 
储 空 间 。 这 些 函 数 都 定义 于 源 文件 bigint. c 中 ,读者 可 打开 文件 夹 numbertheory 中 的 该 文 
件 研 读 。 


6.2 初等 数论 的 概念 


本 节 介 绍 关 于 整数 集 Z=={…, 一 2, 一 1, 0, 1,2,…} 和 自然 数 集 N={0, 1, 2,…} 上 
的 初等 数论 的 一 些 基 本 概念 。 


1. 整除 性 和 约 数 


一 个 整数 能 被 另 一 个 整数 整除 的 概念 是 数论 的 核心 概念 之 一 。 符 号 d | a( 读 作 “d 整 
除 a”) 意 为 有 某 个 整数 ,使 得 a 二 kd。 每 个 整数 整除 0。 车 a 二 0 Hd | a. 则 |d| lal. 
若 d | a, 则 说 a kd 的 一 个 倍数 。 若 d 不 能 整除 a Hd a。 注 意 d | a 当 且 仅 当 一 d | 
a, 由 于 a 的 一 个 约 数 的 相反 数 也 是 a 的 约 数 ,所 以 ,不 失 一 般 性 ,定义 约 数 是 非 负 的 , 即 若 
d | a 且 d 写 0, 就 说 d 是 a 的 一 个 约 数 。 一 个 整数 a 的 约 数 至 少 为 1 但 不 大 于 |a|。 例 如 ， 
24 的 约 数 有 1、2、3、4、6、8、12 和 24。 

每 个 整数 a 都 能 被 平凡 约 数 1 和 a 整除 。a 的 非 平凡 约 数 也 称 为 a 的 因数 。 例 如 ,20 
的 因数 是 2.4.5 和 10。 


2. 余数 和 模 等 价 类 


给 定 整 数 久 ,全 体 整 数 可 按 被 n 除 的 不 同 余数 加 以 划分 。 定 理 6-1 是 这 一 分 类 的 基础 。 

由 于 对 给 定 的 正 整 数 , 对 于 任意 整数 a, 根据 定理 6-1, 都 有 唯一 的 a 除 以 n 的 余数 7， 
AL 0<r<n. ir 只 可 能 是 集合 {0. 1. 2,…, nn 一 1) 中 的 一 个 元 素 。 如 果 两 个 整数 a 和 2 BR 
以 的 余数 相同 , 称 a Alb KF Kn 同 余 , 记 为 a 三 5 (mod n)。 显 然 ,4 三 5b (mod n) 当 且 仅 
当 存 在 整数 上 ,使 得 a 一 b= 二 kn。 

整数 间 关 于 模 n 同 余 的 关系 是 一 个 等 价 关 系 , 即 关 系 二 满足 传递 性 、 对 称 性 和 自 反 性 。 
所 以 ,可 以 利用 同 余 关系 将 整数 集合 Z 进行 划分 。 把 所 有 关于 模 的 余数 为 -(0 三 r 二 nn) 的 
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整数 构成 的 集合 称 为 模 的 一 个 同 余 类 。 所 以 ,整数 集 Z 共 有 个 关于 模 n 的 同 余 类 。 含 
有 整数 a Win 的 同 余 类 记 为 
[a],={atkn : kEZ}. 
例如 ,[3]; 一 {…， 一 11, 一 4, 3, 10, 17, …); 此 集合 也 可 表示 为 [一 4];,[10J:,…。 注 
意 ,写法 a€[6b], 和 a — b (mod n) 是 一 样 的 。 所 有 这 样 的 同 余 类 构成 的 集合 为 
Z, = {{a],: 0<Xa<n—1} (6-3) 
为 表达 方便 ,常用 记号 
Z. = {0, 1, **,2—1} (6-4) 
来 表示 式 (6-3) ,将 其 中 的 0 理解 为 [0],,1 理解 为 [1], 等 ,将 集合 Z 中 每 一 个 类 表示 成 其 
中 最 小 的 非 负 元 素 。 要 记 住 同 余 类 的 本 质 。 例 如 ,对 Z 中 一 1 的 引用 就 是 对 [2 一 1], 的 引 
用 ,因为 一 1 三 n 一 1 (mod n), 
关于 整数 的 同 余 关 系 有 如 下 的 常用 性 质 。 
#a=b (mod n), 则 有 如 下 关系 。 
(1) 对 任意 的 整数 c, 有 


a+c=b+c (modn), (6-5) 
(2) 对 任意 的 整数 ,有 
ac — bc (mod n). (6-6) 
CD 对 任意 的 正 整数 c, 有 
ac — bc (mod nc), (6-7) 
CD 若 还 有 
r- y (mod7), 则 ar 三 by (mod D, (6-8) 


为 说 明 本 章 以 后 若干 重要 结论 ,在 此 证 明 一 个 关于 整数 同 余 关系 的 重要 性 质 。 

定理 6-2. Ka 和 wb 是 满足 a | b Mb>0 的 整数 。 对 任意 的 整数 z 和 yz 三 y (mod 
b) HWA x = y (mod a), 

WEBB 由 a |2, 知 有 &AEN, 使 得 0 一 ka。 于 是 : 

x = y (mod b) 

> Jk EN, {Eí z—y—h'b 

—x— y—k'ka =(k'k)a 


=>x=y (mod a) 
3. 应 用 


整数 关于 模 的 等 价 类 有 广泛 的 实际 背景 。 例 如 ,大 写字 母 的 编码 值 就 构成 一 个 模 为 
26 的 等 价 类 Zs 二 10, 1. cer. 25}。 具 体 地 说 ,任何 一 个 大 写字 母 的 编码 值 x 减 去 'A' 的 编 
码 值 , 必 为 0 一 25 之 一 。 下 列 的 问题 就 涉及 该 等 价 类 。 
The Hardest Problem Ever 


Description 
Julius Caesar lived in a time of danger and intrigue. The hardest situation Caesar ever 


faced was keeping himself alive. In order for him to survive. he decided to create one of 
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the first ciphers. This cipher was so incredibly sound. that no one could figure it out 
without knowing how it worked. 

You are a sub captain of Caesar's army. It is your job to decipher the messages sent 
by Caesar and provide to your general. The code is simple. For each letter in a plaintext 
message, you shift it five places to the right to create the secure message (i. e. . if the 
letter is 'A', the cipher text would be 'F '). Since you are creating plain text out of 
Caesar's messages. you will do the opposite: 

Cipher text 

ABCDEFGHIJKLMNOPQRSTUVWXYZ 

Plain text 

VWXYZABCDEFGHIJKLMNOPQRSTU 

Only letters are shifted in this cipher. Any non-alphabetical character should remain 
the same, and all alphabetical characters will be upper case. 

Input 

Input to this problem will consist of a (non-empty) series of up to 100 data sets. Each 
data set will be formatted according to the following description. and there will be no 
blank lines separating data sets. All characters will be uppercase. 

A single data set has 3 components. 

(1) Start line - A single line, "START". 

(2) Cipher message - A single line containing from one to two hundred characters. 
inclusive. comprising a single message from Caesar. 

(3) End line - A single line. "END". 

Following the final data set will be a single line. "ENDOFINPUT". 

Output 

For each data set, there will be exactly one line of output. This is the original 
message by Caesar. 

Sample Input 

START 

NS BFW, JAJSYX TK NRUTWYFSH] FWJ YMJ WJXZQY TK YWNANFQ HFZXJX 

END 

START 

N BTZQI WFYMJW GJ KNWXY NS F QNYYQJ NGJWNFS ANQQFLJ YMFS XJHTSI NS WTRJ 

END 

START 

IFSLJW PSTBX KZQQ BJQQ YMFY HFJXFW NX RTWJ IFSLJWTZX YMFS MJ 

END 

ENDOFINPUT 


Sample Output 
IN WAR. EVENTS OF IMPORTANCE ARE THE RESULT OF TRIVIAL CAUSES 
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I WOULD RATHER BE FIRST IN A LITTLE IBERIAN VILLAGE THAN SECOND IN ROME 
DANGER KNOWS FULL WELL THAT CAESAR IS MORE DANGEROUS THAN HE 


凯撒 的 部 队 间 传递 的 消息 加 密 规则 很 简单 : 消息 由 大 写字 母 及 标点 符号 组 成 。 字 母 按 
各 自 与 其 后 第 5 个 字母 对 应 ,标点 符号 保持 不 变 的 方式 转换 成 密 文 。 你 的 任务 是 将 收 到 的 
密 文 解 密 为 明文 。 

为 使 行文 简洁 ,将 字符 'A'、'"B'、…、' Z' 的 编码 值 就 用 自身 表示 。 设 密 文 文本 存储 为 数 
组 cipher[1. .nj,cipher[i](1 志 i 过 nn) 为 第 i 个 字符 的 编码 值 。 若 cipher[ 门 为 一 个 大 写字 
母 ,cipher[ 让 对 应 的 明文 字母 的 编码 值 为 zx, 则 


(a—'A'+5) mod 26 —cipher[i]— 'A" 


此 表达 式 蕴涵 着 : 
GipherLi]— 'A'—5) mod 26=2—'A' 
即 


x=((cipher[i]— 'A'—5) mod 26) 3- 'A' 
利用 此 式 ,将 解密 过 程 实现 为 如 下 函数 。 


1 char * decode(char * cipher) { 

2 int n=strlen(cipher) ,i; 

3 char * plain— (char * )calloc(n+1, sizeof(char) ) ; 

4 for(i=0;i<n;it++) 

5 ifCcipher[i] — — 'Z '&. &.cipherLi] >= 'A / * cipher[ 训 是 字母 * / 

6 plain[ i] — (cipher[i]— 'A'+21)%26+ 'A'; / * 21 与 一 5 关于 模 26 等 价 * / 
7 else 

8 plain[i]-cipher[i]; 

9 return plain; 

10 } 


程序 6-7 fW The Hardest Problem Ever 问题 的 解密 函数 


对 程序 6-7 的 说 明 如 下 。 

(1) 函数 decode 的 参数 cipher 是 表示 消息 密 文 的 字符 串 。 函 数 返回 对 cipher 解密 后 
的 明文 字符 串 。 

(2) 函数 体 中 定义 的 字符 指针 变量 plain 用 来 指向 存储 消息 明文 的 字符 串 。pain 也 是 
函数 的 返回 值 。 

(3) 第 4 一 8 行 的 for 循环 对 密 文 cipher 中 的 每 个 字符 检测 是 否 为 字母 。 第 6 行 处 理 密 
文字 母 cipher[i。 需 要 注意 的 是 C 语 言 中 整数 的 求 余 运算 aon 与 数论 中 的 模 运算 a mod 
m 有 一 个 微妙 的 区 别 : 若 a 是 负数 ,a%n 是 一 个 负数 。 而 a mod n 二 a%n 十 n, 则 a 是 一 个 正 
数 。 例 如 ,一 5 mod 26 二 一 5%26 十 26 二 21。 于 是 ,解密 表达 式 


(Ccipher[i]— 'A'—5) mod 26) - 'A" 
E C 语言 中 表示 为 第 6 行 中 的 
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Cipher[i]— 'A '4-21) 2626 3- 'A ". 


调用 函数 decode 解决 The Hardest Problem Ever 问题 的 完整 程序 存储 在 文件 夹 
chap06\The Hardest Problem Ever 中 的 源 文件 TheHardestProblemEver. c 中 ,读者 可 打开 
文件 研读 。 


4. 素数 与 合 数 


如 果 一 个 整数 (a 二 1) 只 有 平凡 约 数 1 和 a, 则 称 其 为 是 一 个 素数 。 素 数 有 很 多 特性 并 
在 数论 中 扮演 着 核心 角色 。 前 20 个 素数 依次 为 

2,3, 5. 7. 11, 13, 17, 19, 23, 29, 31, 37. 41, 43, 47. 53, 59, 61, 67, 71 

有 无 穷 多 个 素数 , 即 由 所 有 素数 构成 的 集合 P 是 无 限 集合 。 这 是 因为 ,车 假定 P= {pi， 
ps，…，p,} 为 一 有 限 集合 ,考虑 整数 p= pipe pcd. 车 p 有 一 个 因数 &, 则 由 于 pi. 
Dis ts bs 为 素数 ,所 以 上 不 是 任何 一 个 pi(1 志 i<<n) 的 因数 ,因此 也 不 是 积 py ps s p, 的 因 
数 。 这 样 将 得 到 |1 的 矛盾 。 这 说 明 p 没有 因数 。 这 又 与 所 有 素数 构成 的 集合 P= pne 
ps，*…，pn) 为 一 有 限 集合 矛盾 ,所 以 了 是 无 限 集合 。 一 个 整数 a 二 1 不 是 素数 则 称 其 为 合 
数 。 例 如 ,39 是 合 数 ,因为 3 | 39。 整 数 1 称 为 单位 , 它 既 不 是 素数 也 不 是 合 数 。 类 似 地 , 整 
数 0 和 所 有 的 负 整 数 都 既 不 是 素数 也 不 是 合 数 。 


5. 公约 数 和 最 大 公约 数 


若 整数 4 是 a 的 约 数 且 d 也 是 2 的 约 数 , 则 d 是 a Alb 的 公约 数 。 例 如 ,30 的 约 数 是 
1,2,3,5,6,10,15 和 30, 因 此 ,24 与 30 的 公约 数 是 1.2.3 和 6。 注 意 1 是 任意 两 个 整数 的 
公约 数 。 

公约 数 的 一 个 重要 性 质 如 下 : 

dla 且 d 1。 蕴含 着 d | (a+b) Xd|(a—b) 
更 一 般 地 ,对 任意 的 整数 zx 和 y, 有 
dla 且 d |b 蕴含 着 d | (az 十 by) (6-9) 
此 外 ,车 a | 5, 则 或 lal 三 16b| 或 6 二 0, 这 意味 着 : 
al120 且 0 | 4a 蕴含 着 a =b 

两 个 不 全 为 0 的 整数 a 和 4 的 最 大 公约 数 是 a Alb 的 公约 数 的 最 大 者 。 记 为 gcd(a， 
5)。 例 如 ,gcd(24, 30)=6,gcd(5, 7) 二 1, 以 及 gcd(0, 9) —9, Ha 和 20 不 全 为 0, 则 ged 
(a, 5) 是 介 于 1 与 min(|al, 15|) 之 间 的 一 个 整数 。 约 定 gcd(0, 0) 为 0; 这 一 约定 对 于 建立 
gcd 函数 (如 式 (6-10)) 的 标准 通用 性 是 必需 的 。 

ged 函数 的 基本 性 质 如 下 。 


gcd(a, b) = gcd(b, a) (6-10) 
gcd(a, b) = gcd(—a, b) (6-11) 
gcd(a. b) = ged(| al. | 6 D (6-12) 
gcd(a, 0) =| a | (6-13) 
对 任意 的 &E Z.ged(a. ka) =| a | (6-14) 


下 列 定理 给 出 了 gcd(a, 5) 的 另 一 个 特征 。 
定理 6-3 Fa 和 2 是 任意 不 全 为 0 的 整数 , 则 gcd(a, 5) 是 a Flo 的 线性 组 合 的 集合 
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{az 十 by : z，yEZ} 中 正 的 元 素 的 最 小 者 。 

证 明 设 * 是 e 和 2 的 最 小 的 正 的 线性 组 合 ,并 设 ;二 ar 十 by, 其 中 zx, yEZ。 设 g = 
la/s J, Wl. 

a mod s — a— qs 
= a — qCar + by) 
=a (1— qr) +b(— qy) 

所 以 a mod s 也 是 a Kb 的 线性 组 合 。 由 于 a mod s<s.# a mod s 二 0, 这 是 因为 ; 是 这 样 
的 线性 组 合 中 正 的 最 小 者 。 所 以 * | a, 并 且 由 类 似 的 理由 ,s | 5。 于 是 ,s 是 a 和 2 的 一 个 公 
约 数 ,所 以 gcd(a, b)>s, (6-9) BFE gcd(a, b) | s, 这 是 因为 gcd(a, 5) 既 能 整除 a 又 
能 整除 5, 且 s 是 a 与 5 的 线性 组 合 。 但 gcd(a, b) | s Hs >0 意味 着 gcd(a, D<s, GA 
gcd(a, b)=>s Fil gcd(a, D) s 推导 出 gcd(a, b) —s. HI s 是 a 和 2 的 最 大 公约 数 。 

推论 6-1 对 任意 的 整数 a 和 465, 车 d | ad | 5, 则 4d | gcd(a, b). 

证 明 这 是 因为 按 定理 6-3,gcd(a, 5) 是 a 和 2 的 线性 组 合 。 再 利用 式 (6-9), 此 推论 
得 证 。 

推论 6-2 ”对 所 有 的 整数 a 和 6 以 及 任意 非 负 整数 : 

gcd(an, bn) = n gcd(a, b) 

证 明 # n—0.dHfEiETS TE. 4 n> 0. Nl gcd(an, bn) 是 集合 {anz 十 bny} 中 正 的 最 
小 者 ,而 它 是 集合 {az 十 by} 中 正 的 最 小 者 的 n 信 。 

推论 6-3 对 所 有 的 正 整数 nva Mb. n ab H gedla, n)=1.W n | b. 

证 明 由 于 gcd(a,n)==1, 根 据 定理 6-3, 有 整数 x 和 y, 使 得 az 十 zay 王 1。 于 是 ,apz 十 
nby 二 5b。 等 式 的 左边 两 项 均 能 被 n 整除 ,这 蕴含 着 右边 的 5 能 被 整除。 


6. 互 质 


两 个 整数 a、b, 车 它们 只 有 公约 数 1, 即 车 gcd(a, 5b) 二 1, 则 称 它们 是 互 质 的。 例如 ,8 和 
15 是 互 质 的 ,这 是 因为 8 的 约 数 是 1.2.4 和 8, 而 15 的 约 数 是 1.3.5 和 115。 定理 6-4 断言 
车 两 个 整数 都 与 整数 p 互 质 , 则 它们 的 乘积 也 与 p 互 质 。 

定理 6-4 对 任意 的 整数 we. A p. HA gcd(a, p) —1 A ged(b, p)=1, W] gcd(ab， 


p-—l. 

证 明 由 定理 6-3, 存 在 整数 Ly a A y 使 得 
ax+py =1 
be’ + py’ =1 

将 此 两 个 等 式 相 乘 ,并 整理 得 : 


ab(axx') + pCybx! + y'ar + pyy ) —1 
由 于 1 是 ab 和 zp 的 正 的 线性 组 合 , 根 据 定理 6-3 就 完成 了 证 明 。 
WRR m, monom 是 两 两 互 质 的 , 若 只 要 IAG ,就 有 gedo. n;j)—l. 
定理 6-5 对 任意 非 0 整数 a RED d=gcd(a. b). W) ged(a/d. b/d) —1. 
证 明 it c= ged(a/d. b/d), W c1. AWEH c—1. Hs EB] c1. HF c| (Co/d) 且 
cl (b/d) ,所 以 cdle 且 cd12。 根 据 推 论 6-1 知 cdld, 这 意味 着 cdd, hF 421. dk cc. 
由 此 可 见 ,1=c==gcd(a/d, b/d). 
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推论 6-4 若 ac=be (mod n).ged(c. n) —d. W] a=b (mod n/d). 
WEBB 由 ac 寺 bc (mod 22.1 nlcCa — 0) Bl (n/d) | CCc/d) (a 一 5b))。 按 定理 6-5 知 
gcd(c/d. zy/d) 王 1, 由 推论 6-3 知 (n/d)| (a 一 5)。 此 即 a=b (mod n/d). 


7. 唯一 分 解 


关于 被 素数 整除 的 一 个 基本 却 很 重要 的 事实 如 下 。 

定理 6-6 对 所 有 的 素数 p 和 所 有 的 整数 a bE p lab. WI pla 或 p15( 或 两 者 都 有 )。 

WEB] 用 反 证 法 。 假定 p | ab {Ap a Hp b. TJÉ.gcd(a. p) —1 H ged, p)=1, 
这 是 因为 p 的 约 数 是 1 和 p, 且 由 假设 p 既 不 能 整除 a 也 不 能 整除 5。 则 定理 6-4 蕴含 着 
gcd(ab，p) 二 1, 此 与 p | ab 且 由 此 而 得 的 gcd(ab， 思 ) 一 户 矛 盾 。 这 一 矛盾 就 完成 了 证 明 。 

定理 6-6 的 一 个 推论 是 一 个 整数 有 唯一 的 素 因数 分 解 。 

定理 6-7( 唯 一 分 解 ) GMa 可 以 写成 唯一 的 乘积 形式 a 二 pr p? s py ,其 中 pi 是 素 
TE pi pim puse; 是 正 整 数 。 

WEBB IER =p} prepr =q a egi IEP pig GSL, 2,…,r, j71 2, 
1) 为 素数 , 且 pi pi p qi KLK BR, iL imu WA qi | pp pe AR 
据 定理 6-6: 


319j.1« jKr ffs q? | pq — p; Hei<e; (6-15) 
相仿 地 可 得 Vj,1< jm 
3lólXixuop 4q Be; €c, (6-16) 


由 式 (6-15) 和 式 (6-16) 表 示 的 对 应 的 唯一 性 ,有 cr. VIS jer p= q; Hej =e. 
定理 由 此 得 证 。 
作为 例子 , 数 6000 可 以 被 唯一 地 分 解 为 2: X3X5。 


6.3 最 大 公约 数 


本 节 中 ,描述 有 效 计算 两 个 整数 的 最 大 公约 数 的 Euclid 算法 。 运 行 时 间 的 分 析 涉及 
Fibonacci 数 , 由 此 导出 Euclid 算法 的 最 坏 情形 的 输入 。 
本 节 中 ,限于 讨论 非 负 整数 。 这 一 限制 根据 式 (6-12) 是 正确 的 ,该 式 断言 gcd(a, b) — 


gedClal. Ibl. 
理论 上 ,可 以 由 正 整 数 AD 的 素 因 数 分 解 来 计算 a Alb 的 geda, D). EREI: 
a= pi pi pe (6-17) 
b= pp pp po (6-18) 
则 : 
gcd (a.b) 一 prin ifi) gin Gef) see prin Gu (6-19) 


然而 ,如 将 在 6. 6 节 中 看 到 的 那样 ,到 现在 为 止 ,即使 是 最 好 的 因数 分 解 算法 都 不 是 多 项 式 
时 间 的 ,所 以 这 个 计算 最 大 公约 数 的 方案 并 不 是 一 个 有 效 的 算法 。 


O ”3 | 表示 “存在 唯一 的 ……”。 
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快速 计算 最 大 公约 数 的 Euclid 算法 基于 以 下 定理 。 
定理 6-8(GCD 递归 定理 ) ”对 任 一 非 负 整数 a 和 任 一 正 整 数 b,gcd(a, 5) 二 gcd(b, a 
mod b), 
WEB] 我们 将 证 明 gcd(a, 5) 和 gcd(5, a mod 0 互相 整除 ,所 以 根据 式 (6-9) 它 们 必 相 
等 (这 是 因为 它们 都 是 非 负 的 )。 若 设 d= ged(a. DD. Wl d | a fld | 5。 根据 定理 6-1,(a 
mod b) 二 a 一 gb, 其 中 q=La/n |, 这 样 ,Ca mod 6b) 可 视 为 a 和 2 的 线性 组 合 , 式 (6-9) 蕴 含 着 
d | (a mod 5)。 于 是 ,由 于 d | b 和 d | (a mod D) ,根据 推论 6-1,d | ged(b, a mod 5b) 或 等 
价 地 
gcd(a, b) | gcd(b, a mod b) (6-20) 
WEB] ged(b, a mod b) | gcd(a, 5b) 几乎 是 一 样 的 。 今 设 d==gcd(b, a mod b). W) d | b 
H.d | (a modb), HF a=qb+ (a mod 5), 其 中 g —|a/b ,有 a 是 5 和 (a mod b) HAHA 
合 。 根 据 式 (6-9) ,推出 d | a。 由 于 d |b Hd | a, 根 据 推论 6-1 A d | gcd(a, 0) 或 等 价 地 
gcd(b, a mod b) | gcd(a, b) (6-21) 


6.3.1 Euclid 算法 


Euclid( 约 公元 前 300 年 ) 原 理 描述 了 下 列 ged 算法 ,尽管 它 可 能 源 于 更 早 。Euclid 算 
法 表示 成 直接 基于 定理 6-8 的 一 个 递归 过 程 。 输 入 的 a 和 2 是 任意 的 非 负 整数 。 


EUCLID(a, b) 


1 ifb=0 
2 then return a 
3 else return EUCLID(4, a mod b) 


算法 6-6 计算 B 进 制 正 整数 a .6 的 最 大 公约 数 的 递归 过 程 


作为 运行 EUCLID 的 一 个 例子 ,考虑 计算 gcd(30, 21): 
EUCLID(30, 21) = EUCLID(21.9) 
= EUCLID(9.3) 
= EUCLID(3.0) 
一 3 


在 此 计算 中 ,三 次 调用 EUCLID。 

EUCLID 的 正确 性 源 于 定理 6-8 和 如 下 事实 : 若 算法 在 第 2 行 返回 4a, 则 b= 二 0, 故 
式 (6-13) 列 含 着 gcd(a, D) 一 gcd(a, 0) 一 4。 算法 不 会 无 限 递归 ,这 是 因为 每 次 递归 调用 的 
第 二 个 参数 都 严格 递减 且 总 是 非 负 的 。 所 以 ,EUCLID 总 是 正确 终止 。 


6.3.2 EUCLID 算法 的 运行 时 间 


把 EUCLID 的 运行 时 间作 为 a 和 2 的 比特 位 数 的 函数 来 加 以 分 析 。 不 失 一 般 性 ,假定 
a 记 b 宇 0。 这 一 假定 是 正确 的 ,因为 车 ba 宇 0, 则 EUCLID(a, 5) 马 上 就 递归 地 调用 EUCLID 
(5，a)。 也 就 是 说 ,如 果 第 一 个 参数 比 第 二 个 参数 小 ,EUCLID 将 花费 一 次 递归 调用 来 交换 
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它们 ,然后 再 来 处 理 。 类 似 地 , 若 "一 a 之 0, 过 程 在 一 次 递归 调用 后 终止 ,因为 c mod 2 一 0。 
EUCLID 总 的 运行 时 间 正 比 于 它 所 进行 的 递归 调用 的 次 数 。 我 们 的 分 析 要 用 到 下 列 定 
义 的 Fibonacci & F, 。 
F,-—0,. 
F, =1, 
F,=Fatha 222 
于 是 ,每 个 Fibonacci 数 都 是 它 前 面 两 个 数 的 和 。 这 就 得 出 了 序列 : 
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, -- 
引 理 6-3 # a7 5251 H EUCLID(a, 65) 执行 了 k 宇 1 次 递归 调用 , 则 a> FB 
bF o 
WEBB 对 上 做 数学 归纳 。 对 k=1 tbl F, Ah T a>b, VH au 过 2 一 Fe 。 由 于 
b>(a mod b) ,在 每 次 递归 调用 中 第 一 个 参数 严格 大 于 第 二 个 参数 ;a>2 的 假定 对 每 个 递归 
调用 都 是 成 立 的 。 
归纳 地 假定 引 理 对 k 一 1 次 递归 调用 是 真 的 ;将 证 明 对 k 次 递归 调用 也 是 真 的 。 由 于 
k>0,4 b>0 H. EUCLID(a, 5) 递 归 地 调用 EUCLID(56, a mod b) ,而 EUCLID(, a mod b) € 
做 4 一 1 次 递归 调用 。 根 据 递 归 假 设 , 有 6 三 Fiii, 且 (a mod 5) 三 Fi。 按 本 引 理 的 条 件 
a 之 b>0, 此 蕴含 着 [a/b > 1。 于是， 
b+ (a mod 0) — b+ (a —la/b |b) 
<a 
因此 ， 
a Z b (a mod b) 
之 Fen +F: 
= Frye 
下 列 定理 是 此 引 理 的 直接 推论 。 
定理 6-9(Lamé 定理 ) 对 任 一 整数 421.45 a7 0271 且 O<F,,,. Mil) EUCLID., 0 执行 
的 递归 调用 次 数 少 于 A。 
可 以 证 明定 理 6-9 的 上 界 是 最 好 的 。 连 续 的 Fibonacci 数 是 EUCLID 的 最 坏 情 形 的 输 
A. WF EUCLID (Fs，F; ) 恰 做 了 一 次 递归 调用 , 且 因 为 对 之 2, 有 Fit mod F, = 
Fia ,所 以 
gcd(Fisis F) = gedCF,. (Fir1 mod Fi)) 
= gcd(F,. Fy-1) 
TJÉ.EUCLIDCF,4, o FOR &— 1 次 ,符合 定理 6-9 的 上 界 。 
Fibonacci 数列 与 如 下 定义 的 黄金 比率 p A CIE fi X: 


p= 1 = = 1.61803". ĝ= E =— 0. 61803--- 


明确 地 说 ,可 以 用 数学 归纳 法 证 明 : 


_¢-¢ 
=- 


HFI A | e 1/5 1/5 过 1/2, 所 以 第 个 Fibonacci 数 等 于 yg*/V5 的 四 会 五 人 后 的 
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整数 值 。 所 以 ,EUCLID 的 递归 调用 次 数 为 O(lgb)。 这 就 推导 出 若 将 EUCLID 用 于 两 个 8 二 
进 制 位 的 整数 它 将 执行 0(B) 次 算术 运算 和 O(8:) 次 位 运算 (假定 B 二 进 制 位 整数 的 乘法 和 
除法 执行 0(8?) 次 位 运算 )。 


6.3.3 Euclid 算法 的 迭代 版 本 


递归 过 程 EUCLID 是 末尾 递归 ,很 容易 写 出 与 之 等 价 的 迭代 版 本 。 


GcD(a, b) 

1 while 5750 

2 do r<a mod b 
3 ab 


算法 6-7 FARRAH B 进 制 整数 a b 的 最 大 公约 数 的 过 程 


数论 把 上 述 的 GCD 过 程 称 为 驾 转 相 除 法 。 
车 5 二 0, 则 gcd(a, =a. Ail) 
go — la/b lyro — a mod b(£ 0) «a = qob + ro; 
qı -—|b/r, lri — b mod r, (Æ 00.5 = qiro +r; 


qi 7 eris /ri bri < ri mod ra (Æ O «ria = qiria t ri 


qi m ars Iri re ro mod ra (FO) rea = qua res d rus 
Am 7 lr / ra Jer, = rs mod rao 0) ra = qur» 
根据 定理 6-7. r.a = ged(r, ara) = BEd CFn- s Fm) = ged(ri iri) 
gcd(ro, ri) — ged(b. rj) —ged(a. b). 
由 第 1 个 式 子 得 
ro = a — qob 
由 第 2 个 式 子 得 
n= 6b— qr 
=(—g)a+(g+Db 


一 般 地 ,对 OS} <ir; WKH rj = xja + yb MI 
ri= Tris — Qi 
= ( xi-aa + yib) — qiC xia + yib) 
= ( Ziz — qi xia d C yis — qi Yi )b 
TE, Fi 
x41, ya420 


z,=0, y=1 
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则 可 得 递 推 公式 : 

XQ— Ter UT» Y= ye dy 一 0)1 2 
利用 此 递 推 公式 就 可 在 用 轨 转 相 除法 计算 < 最 大 公 余数 4 的 同时 ,计算 出 满足 定理 6-3 
表示 的 线性 组 合 系数 x 与 y ,使 得 4 一 gcd(a, 5b) 二 za 十 yb。 写 成 伪 代 码 过 程 如 下 。 


EXTENDED-GCD(a, b) 

1x10, x1» ytl, y—0 

2 while b40 

3  doq-la/b |, r--a mod b, x: x —qxi4 2 y —a» 
4 atb, ber, is xi x1: YN» Y 


5 return (a, z, y) 
算法 6-8 计算 定理 6-3 描述 的 最 大 公约 数 线性 组 合 的 过 程 


算法 6-8 与 算法 6-7 一 样 , 是 一 个 循环 结构 。 并 且 循 环 条 件 以 及 循环 体内 对 ab 及 
的 处 理 也 是 一 样 的 。 所 以 ,算法 6-8 的 运行 时 间 也 是 OCB?) ,其 中 8 表示 a wb 的 位 数 。 


6.3.4 程序 实现 


本 章 所 有 算法 都 可 以 对 系统 定 长 整 型 数据 和 在 前 定义 的 基数 为 Base = 10° 的 长 整数 
BigInt 数据 加 以 实现 。 本 节 就 计算 非 负 整数 a、b 的 最 大 公约 数 为 例 , 列 出 其 对 两 种 类 型 数 
据 的 实现 代码 ,并 加 以 详细 解析 。 读 者 可 对 比 深入 领会 数论 算法 的 特点 一 一 对 位 的 操作 。 


1 typedef unsigned long long ul_int; 

2 typedef long long l int; 

3 ul int egcd(ul int a, ul int b, Lint * x, Lint * y){ 
4 ulintq, r; 

5 Lint x1—0, x2, yl=1, y2; 

6 *x=1;* y=0; 

7 while(b){ 

8 q=a/bsr=a%b;x2= * x—q* xliy2— * y—q* yl; 

9 a=b;b=r; * x-xl;x1l—x2; * y=yl;yl=y2; 

10 } 

11 return a; 

12 } 

13 BigInt extendedEuclid(BigInt a, BigInt b, BigInt* x, BigInt* y){ 

14 BigInt r={NULL,0},q={NULL,0} ,tl={NULL,0} ,t2={NULL,0}, 


15 x1 — newIntBystring("0") , /*xl—0*/ 

16 yl— newIntBystring("1") ; /*yl—1x*/ 

17 x2={NULL,0}, y2={NULL,0},al={NULL,0},b1={NULL,0}, 
18 intAssign(&-al ,a) ,intAssign(&-bl,b), /*al<a, bl<b*/ 

19 intAssign(x, yl) .intAssign(y. x1); /* xwylsy<xl * / 

20 al. sign=bl. sign—0; 

21 while(!isZero(b1)){ / * while b#0 * / 

22 clrBigInt( &q) . clrBigInt( 8-7) ; / * ERE qur Sia] * / 
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23 r. value 一 createList(sizeof(long) , NULL) ; 


24 q. value= valueDivision(al. value, bl. value, r. value) ;/ * q«-a/b, r*-a mod bx / 

25 clrBigIntC 8-t1) ,clrBigInt( 8-12) ,t1=product(q, x1) ,t2=product(q, yl); 

26 clrBigInt( & x2) , clrBigInt( 8.2) ， /* 清理 x2、y2 的 空间 * / 

27 x2— diffC * x,tl), y2=diff( * y,t2)5 / * x2<-x—qxl, y2«-x— qy2 * / 
28 intAssign( &-al ,bl) ;intAssign S-bl.r); /*a*b, ber*/ 

29 intAssign( x. x1) ;intAssign(y,yl); /* xxl, yyl*/ 

30  intAssign( &-x1, x2) sintAssign Byl,y2); / * xl<-x2,yl<-y2 * / 

31) 


32 clrBigInt(&-b1) sclrBigInt 8-9) ;clrBigIntC &r) ;clrBigInt( & x1) ; / * 清理 各 临时 变量 的 空间 * / 
33 clrBigInt(&-y1) ; clrBigInt( & x2) ;clrBigInt( & y2) ; clrBigInt( 8-01) ;clrBigInt( &-t2) ; 


34 return al; / * return a * / 


程序 6-8 ”实现 算法 6-8 EXTENDED-GCD 过 程 的 C 函数 


对 程序 6-8 的 说 明 如 下 。 

CD 为 使 代码 简洁 ,第 1 行 和 第 2 行 定义 unsingned long long fil long long 的 别名 分 别 为 
ul int AI] int, 

(2) 第 3—12 行 定义 的 函数 egcd 实现 算法 6-8 的 EXTENDED-GCD 过 程 , 对 参数 ab 表 
示 的 两 个 ul_int 型 数据 计算 最 大 公约 数 d, 以 及 d 关 于 ab 线性 组 合式 中 的 系数 x 和 >y。 函 
数 的 返回 值 为 a、b 的 最 大 公约 数 d, 而 d X T a.b 线性 组 合 的 系数 由 指针 参数 x、y 指引 。 
函数 体内 的 程序 代码 与 算法 过 程 的 伪 代 码 十 分 接近 。 

(3) 第 13 一 35 行 定 义 的 函数 extendedEuclid 是 实现 算法 6-8 的 BigInt WA, PA BGR 
回 参 数 ab 的 最 大 公约 数 d,d 关于 a b 的 线性 组 合 系数 由 指针 参数 x、y 指引 。 

函数 体 中 定义 的 变量 x1 x2 yl.y2 与 算法 中 同名 变量 的 意义 相同 。 

在 a,b 最 大 公约 数 的 计算 过 程 中 要 改变 a、b 的 值 ,虽然 C 函数 的 参数 是 按 值 传递 ,但 由 
于 ab 是 BigInt 类 型 的 对 象 ,其 成 员 属 性 value 是 指向 链表 的 指针 ,改变 ab 的 值 就 会 造成 
value 指引 的 链表 中 的 结 点 数据 发 生变 化 ,所 以 设置 变量 al .bl EX a, b 在 运算 过 程 中 的 
替身 。 

由 于 BigInt 类 型 对 象 的 value 属性 是 一 个 链表 指针 ,对 其 直接 赋值 value 将 指向 另 一 个 
链表 执行 赋值 运算 a=b 后 的 内 存 情 形 如 图 6-1(a) 所 示 ,所 以 ,为 向 一 个 BigInt 对 象 a 赋值 
b, 需 要 先 对 对 象 a 做 清空 value 空间 的 操作 ,清空 BigInt 对 象 value 属性 空间 的 操作 由 函数 
clrBigInt 完成 ,其 原型 声明 为 


void clrBigInt(BigInt * a); 


除了 对 一 个 BigInt 变量 赋值 前 需要 执行 clrBigInt 操作 外 ,程序 执行 完毕 前 ,所 有 临时 的 
BigInt 变量 也 要 执行 此 操作 ,以 防 内 存 泄 漏 。 这 样 可 能 导致 数据 操作 的 安全 性 ,然后 将 b 的 
value 链表 复制 给 a 的 value。 

将 一 个 BigInt WH a 克隆 为 b 的 操作 由 函数 intAssign 完成 ,调用 函数 intAssign( &-a,b) 
的 内 存 情形 如 图 6-1(b) 所 示 。 其 原型 声明 为 


void intAssign(BigInt * a. BigInt a); 
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a a 
li i -| | errs EN 
value EN value 
sign| x sign| x 
Î intAssign(&a, b) 

b b 
value - - xo =| value =| sg (I eee —- 
sign | x sign | x 

(a) (b) 


图 6-1 BigInt 变量 的 赋值 与 复制 


在 过 程 运行 时 ,需要 做 迭代 as qan s yete qy: ERRUR x、y、xl、yl、x2、y2、q 
都 是 BigInt 型 对 象 , 它 们 之 间 的 算术 运算 都 需要 调用 事先 定义 好 的 函数 product 和 diff 来 
完成 ,函数 返回 的 也 是 BigInt 对 象 ,直接 将 函数 值 赋值 , 则 下 一 次 迭代 时 就 可 能 丢弃 原来 的 
value 属性 , 那 将 造成 内 存 泄 漏 。 因 此 ,设置 中 间 变 量 1 \t2 接受 运算 函数 product 调用 返回 
值 ,每 次 迭代 前 先 调 用 函数 clrBigInt 清空 原来 的 空间 。 

计算 两 个 BigInt 对 象 a 与 b 的 积 ab 的 函数 product 的 原型 声明 如 下 : 


BigInt product(BigInt a, BigInt b) ; 
计算 两 个 BigInt 对 象 a 与 b 的 差 a—b 的 函数 diff 的 原型 声明 如 下 : 
BigInt diff(BigInt a, BigInt b); 
上 述 4 个 函数 均 定义 在 numbertheory 文件 夹 中 的 源 文件 bigint. c 内 ,它们 的 原型 声明 于 同 


一 文件 夹 内 的 头 文件 bigint. h 中 。 
计算 a.b 的 绝对 值 相 除 的 商 和 余数 用 一 个 valueDivision 函数 完成 ,其 原型 声明 如 下 : 


LinkedList * valueDivision(LinkeList * x, LinkedList * y, LinkedList * r); 


该 函数 计算 存储 于 x y. 中 的 两 个 大 整数 的 绝对 值 相 除 的 商 和 余数 ,返回 商 , 余 数 由 指针 参数 
r 指 引 。 函 数 定义 于 numbertheory 文件 夹 中 的 源 文件 valuecalc. c 中 ,其 原型 声明 于 同一 文 
件 夹 内 的 头 文件 valuecale. h P. 

程序 6-5 中 定义 的 函数 存储 于 numbertheory 文件 夹 中 的 源 文件 ged. c 中 ,原型 声明 于 
同一 文件 夹 的 头 文件 ged. h 中 。 在 这 两 个 文件 中 还 存储 有 实现 算法 6-7 的 C 函数 的 ul_int 
版 本 和 BigInt 版 本 代码 ,读者 可 打开 文件 研读 。 


6.3.5 应 用 


Jugs 


Description 

In the movie "Die Hard 3". Bruce Willis and Samuel L. Jackson were confronted with 
the following puzzle. They were given a 3-gallon jug and a 5-gallon jug and were asked to 
fill the 5-gallon jug with exactly 4 gallons. This problem generalizes that puzzle. 

You have two jugs, A and B. and an infinite supply of water. There are three types of 


actions that you can use: (1) you can fill a jug. (2) you can empty a jug. and (3) you can 
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pour from one jug to the other. Pouring from one jug to the other stops when the first jug 
is empty or the second jug is full. whichever comes first. For example. if A has 5 gallons 
and B has 6 gallons and a capacity of 8. then pouring from A to B leaves B full and 3 
gallons in A. 

A problem is given by a triple (a. b. n). where a and b are the capacities of the jugs 
A and B. respectively. and n is the goal. A solution is a sequence of steps that leaves 
exactly n gallons in jug B. The possible steps are 

fill A 

fill B 

empty A 

empty B 

pour A B 

pour B A 

success 
where "pour A B" means “pour the contents of jug A into jug B". and “success” means 
that the goal has been accomplished. 

You may assume that the input you are given does have a solution. 

Input 

Input to your program consists of a series of input lines each defining one puzzle. 
Input for each puzzle is a single line of three positive integers; a. b, and n. a and b are the 
capacities of jugs A and B. and n is the goal. You can assume 0a b and n 56-1000 and 
that A and B are relatively prime to one another. 

Output 

Output from your program will consist of a series of instructions from the list of the 
potential output lines which will result in either of the jugs containing exactly » gallons of 
water. The last line of output for each puzzle should be the line "success". Output lines 
start in column 1 and there should be no empty lines nor any trailing spaces. 

Sample Input 

354 

573 


Sample Output 


fill B 
pour B A 
empty A 
pour B A 
fill B 
pourB A 
success 


fill A 
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pour AB 
fill A 
pourA B 
empty B 
pourA B 


success 


1, 问题 分 析 与 算法 描述 


两 个 容量 分 别 为 a Mo 加 仑 的 水 桶 (gcd(a, 00 —1 H a 二 5b)A 和 B, 并 且 有 无 限量 的 水 ， 
通过 若干 次 灌 满 某 个 桶 、 将 某 个 桶 中 的 水 倒 掉 ,将 某 个 桶 中 的 水 倒 进 另 一 个 桶 中 ,这 样 的 操 
作 , 使 得 BB 桶 中 刚好 有 n( 二 5) 加 仑 的 水 。 任 务 是 编写 程序 对 给 定 的 a.bn, 列 出 从 A、B 为 
空 桶 开始 到 达成 目标 (B 桶 中 刚好 有 x 加 仑 水 ) 为 止 的 操作 序列 。 

为 解决 此 问题 ,要 做 两 步 工作 : 首先 要 确定 从 水 池 中 要 对 某 桶 注 满 多 少 次 , 倒 掉 另 一 桶 
多 少 次 能 使 得 B 桶 中 的 水 惟有 加仑, 即 确定 整数 zx、y 使 得 

ax +by =n 

其 中 ry 必 有 一 正 一 负 , 正 者 表示 要 注 满 的 桶 数 , 负 者 表示 要 倒 掉 的 桶 数 。 该 方程 在 数论 中 称 
为 丢 番 图 方程 。 该 方程 和解 的 充分 必要 条 件 是 gcd(a, 5)1n。 本 问题 中 ,由 于 ged(a, b)=1, 
故 必 有 解 。 若 royo 为 上 述 丢 番 图 方程 的 一 个 解 , 则 

x = xX +bt 

?3 一 yo 一 Qt 
为 其 所 有 解 。 也 就 是 说 该 方程 有 无 穷 多 个 解 。 我 们 的 目标 是 求 出 使 得 倒 掉 的 水 最 少 的 x 
和 y。 写 成 伪 代 码 过 程 如 下 。 


GET-XY (a, b. n) 


tEZ 


1 (d, x, y)< EXTENDED-GCD(a, b) 

2 Totan, yo*- yn 

3 min 

4 t0, il, xi Tos m+ Yo 

5 a2 a1 tbi, yt yi—ai 

6 while |[z:al |xial or |y;bl | ybl 

7 — doif min zsa,y2b 中 负数 的 绝对 值 
8 then min<22a,y2b 中 为 负数 的 绝对 值 
9 tei 

10 Xi Yi 

n i—itl 

12 art ribi. yi-— yi—ai 


13 return z, bt, y, 一 Qt 
算法 6-9 计算 使 得 倒 掉 的 水 最 少 的 azd-by— n BRE y 


该 过 程 的 运行 如 下 。 第 1 行 计算 gcd(a, 0 的 线性 组 合 系数 zy. H az 十 by 一 1。 两 边 
FÆ n 得 到 azxn 十 byn 二 n。 第 2 行 令 xo yo 分 别 为 za 和 yn, 则 zo、yo 为 az 十 by 一 的 一 个 
解 。 第 6 一 12 行 的 while 循环 通过 迭代 计算 使 得 倒 掉 的 水 最 少 的 zx 和 y 的 值 。 
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应 当 指 出 , 丢 番 图 方程 的 一 般 解 中 ,参数 1 是 在 整数 集 Z 中 取 值 。 而 在 算法 过 程 中 ,t 取 
正 整数 。 第 6 一 12 行 的 循环 条 件 是 xa 和 yb 不 同时 增长 。 因 为 一 旦 两 者 同时 增长 ,就 会 越 
变 越 大 。 这 样 ,上 述 GET-XY 过 程 仅 适合 于 x —0 的 情形 。 对 于 yo。 一 0 的 情形 ,和 迭代 式 应 
改 成 x; =x — bt, yz =y, tat. 

其 次 ,根据 得 到 的 x 和 y, 确 定 操作 步骤 。 所 有 可 能 的 步骤 均 为 如 下 3 种 操作 之 一 。 

CD 灌 满 B 桶 (或 灌 满 A BD. 

(2) 倒 掉 A 桶 (或 倒 掉 B 桶 ) 。 

C3) 将 B 桶 中 的 水 倒 入 A 桶 (或 将 A 桶 中 的 水 倒 和 人 B 桶 ) 。 

在 x<0 条 件 下 , 即 灌 满 y 桶 BB 倒 掉 xz 桶 人 A 就 可 得 到 加 仑 水 , 伪 代 码 过 程 如 下 。 


JUGS Ca, by n, x, y) 


la *-b «0 
2 while b An 

3 doif y>0 and 5; —0 

4 then bi +b, y-y—1 Dis B 

5 print "fill B" 

6 继续 下 一 轮 重 复 

7 if zx 一 0 and a; =a 

8 then a1 70, x41 上 > 将 A 桶 中 的 水 倒 掉 

9 print "empty A" 

10 继续 下 一 轮 重复 

11 if 0<h <a—a 

12 then b, —0, a; 7a; +b, DH B BP 7k BUE A 桶 
13 else b, +— b, —(a—a,), ay 4a 上 > 用 BB 桶 中 的 水 灌 满 A 桶 
14 print "pore B A" 


算法 6-10 解决 Jugs 问题 的 一 个 案例 的 算法 过 程 


该 过 程 运行 如 下 。 第 1 行将 表示 A 桶 和 了 B 桶 中 水 量 的 变量 w Alb, 初始 化 为 0。 第 2 一 
14 行 的 while 循环 模拟 一 台 自 动机 在 DB 桶 为 空 ;@A 桶 被 灌 满 ;@BB 通 可 倒 水 到 A di 3 4% 
状态 之 间 的 转换 。 其 中 ,第 3 一 6 行 的 证 结构 将 状态 四 转换 为 状态 四 。 而 第 7 一 10 71h if 
结构 是 将 状态 回转 换 为 状态 加。 第 11 一 14 行将 状态 回转 换 为 状态 四 ,B 桶 被 倒 空 或 状态 @ 
A 桶 被 倒 满 。 循 环 直 至 B 桶 中 的 水 量 6b 为 为止。 

2. 程序 实现 

实现 算法 过 程 GET-XY WMF. 


1 void getxy(int a. int b. int n. int * x, int * y){ 


2 long long x0, yO, t—0, i=1, min- LONG MAX.f ,xl, yl, x2, y2; 

3 eged(a, b, &x0, &-y0); / * Y a,b 的 gcd 线性 组 合 系数 x0、y0*/ 
4 f=x0<0? 1:;—1; /* 确 定 符号 因子 * / 

5 x0*—n yO* =n; /* 计 算 丢 番 图 方程 的 初始 解 * / 

6 xl=x0;yl=y0; /* 计 算 和 迭代 解 初始 值 * / 

7 x2=xlt+f* b* isy2=yl—f*a* is /* 计 算 首 次 迭代 解 * / 
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8 ”while(abs(x2) 一 abs(xl) || abs(y2)<abs(y1)){ /* 解 的 绝对 值 不 同时 增 大 * / 
9 if(x2<08.8.—x2 * a<min){ 

10 min=— x2 * a; 

1 t-is 

12 ) 

13 if(y2<0& 8.— y2- min) ( 

14 min=— y2 * b; 

15 t=is 

16 ) 

17 xl=x2;yl=y2; 

18 i++; 

19 x2=xl+f* b*i;y2=yl+f*a%* i; 
20 ) 

21 *x=x0+f* b* t; *y=y0—f* a*t; 
22} 


BF 6-9 实现 算法 6-9 的 C 函数 


对 程序 6-8 的 说 明 如 下 。 

(1) 函数 getxy 有 5 个 参数 。 参 数 a、b、n 的 意义 与 伪 代 码 过 程 的 3 个 同名 参数 一 致 , 表 
示 A 桶 .B 通 的 容量 和 要 在 B 桶 中 保留 的 目标 量 。 指 针 参 数 x y 用 来 向 外 部 返回 所 求 的 丢 
番 图 方程 的 解 。 

(2) 函数 getxy 与 伪 代 码 过 程 不 同 , 它 不 仅 要 解 x00 的 情形 ,也 要 解 yo-0 的 情形 。 
这 两 种 情形 影响 迭代 表达 式 中 + 的 符号 。 因 此 ,设置 符号 因子 {, 并 在 第 4 行 对 其 进行 了 初 
始 化 ,使 得 能 在 迭代 过 程 中 找到 最 小 的 解 。 

G) 第 8 一 20 行 的 while 循环 实现 算法 过 程 中 的 第 6 一 12 行 的 迭代 循环 。 其 中 ,9 一 12 
行 和 第 13 一 16 行 的 两 个 证 语句 跟踪 当前 监测 到 的 使 得 倒 掉 的 水 最 少 的 解 对 应 的 t。 第 21 
行 用 此 t 计算 最 终 得 到 的 解 。 

对 JUGS 过 程 的 实现 代码 如 下 。 


1 char * jugs(int a, int b, int n. int x, int y){ 


2 intal—0, bl=0, a2, b2.xl.yl, * bb; 

3 char A[2]. B[2]. * s— char * )calloc(1000, sizeof(char)) ; 
4 if(x<0){ 

5 a2—a;b2—b;bb— &-bl; 

6 strepy(A,"A");strepy(B,"B"); 

7 xl=x;yl=y; 

8 }else{ 

9 a2—b;b2—a;bb— &al; 

10 strepy(A,"B") ;strepy(B,"A"); 

11 xl=ysyl=x; 

12 ) 

13 while( * bb!=n){ 

14 ifCy18.&.b1— —0)( /* BRB AK * / 
15 bl—b2;yl——; 


293 


从 算法 到 程序 (第 2 NO 


16 streat(s, "fill ") strcat s. B) sstrcatC s, An") ; 

17 continue; 

18 ) 

19 ifCx18.8&.a1— —2a2)( /< 将 A 桶 中 的 水 倒 掉 * / 

20 al 一 0;xl 十 十 ; 

21 strcat(s, "empty ") ;strcat(s, A) sstrcat s, "Vn ; 

22 continue; 

23 } 

24 if(bl<=a2—al){ /*B 桶 中 的 水 可 全 部 倒 入 A 桶 x/ 
25 al—bl-cal;ibl—0; 

26 Jelse{ /*B 桶 中 的 水 只 能 部 分 倒 入 A 桶 x/ 
27 bl=bl—(a2—al);al=a2; 

28 } 

29 streat(s,"pore ");strcat(s,B);strcat(s," ");strcat(s, A);strcat(s,"\n"); 

30 } 


31 streat(s, "success\n"); 
32 return s; 
33] 


程序 6-10 实现 算法 6-10 的 C 函数 


对 程序 6-10 的 说 明 如 下 。 

CD 函数 jugs 有 5 个 与 算法 过 程 一 样 的 参数 。 但 是 ,函数 并 不 直接 向 输出 文件 写 入 信 
息 ,而 是 将 信息 存储 于 一 个 字符 串 中 作为 返回 值 。 

(2) 与 算法 过 程 不 同 ,函数 jugs 不 但 要 处 理 x —0 的 情形 ,也 要 处 理 y-—0 的 情形 。 两 者 
的 区 别 不 仅 体现 于 灌水 操作 的 对 象 和 倒 水 操作 的 对 象 不 同 ,也 影响 输出 信息 的 不 同 。 所 以 ， 
要 设置 变量 a2、b2 来 表示 倒 水 、 汲 水 的 桶 的 容量 ,变量 A、B 表示 倒 水 、 汲 水 的 桶 标识 。xl、 
yl 表示 倒 掉 水 的 桶 数 和 灌 满 水 的 桶 数 。 并 用 指针 bb 指向 真正 的 B 桶 中 所 存 有 的 水 量 的 变 
量 。 这 些 变量 根据 参数 x 的 符号 变化 ,在 第 3 一 12 行进 行 初始 化 。 

(3) 函数 体 中 第 13 一 30 行 的 while 循环 实现 算法 过 程 中 的 第 2 一 14 行 的 while 循环 , 模 
拟 自 动机 在 3 个 状态 间 的 转换 ,直至 真正 的 B 桶 中 的 水 量 为 n。 在 此 过 程 中 ,把 要 记录 的 信 
息 ,加 载 到 字符 串 s 中 。 循 环 结束 时 ,第 31 行 在 s 中 追加 信息 “success”。 

上 述 函 数 getxy 和 jugs 的 定义 ,以 及 调用 函数 getxy 和 jugs 解决 JUGS 问题 的 程序 存 
储 在 文件 夹 chap06\Jugs 中 的 源 文件 Jugs. c 中 ,读者 可 打开 文件 研读 。 


6.4 iss 


若 运算 限于 加 法 .减法 和 乘法 , 模 运 算 与 整数 的 运算 一 样 ,不 过 若 运 算 的 模 是 , 则 每 一 
个 计算 结果 z 都 要 被 Z, 二 {0, 1. 7. 2 一 1} 的 元 素 所 替代 , 即 等 价 于 z mod z( 即 用 z mod n 
BI. 
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6.4.1 模 加 法 和 乘法 


对 Z, 定义 加 法 和 乘法 运算 并 不 困难 ,因为 两 个 整数 的 等 价 类 唯一 地 确定 其 和 与 积 的 等 
价 类 , 即 车 a = a’ (mod n) H b 三 5 (mod 2) W) 
a d b — a' +b' (mod n) 
ab = a'b/ (mod n) 
于 是 ,如 下 定义 模 的 加 法 和 乘法 , 记 为 十 , Ale as 
[a], +.[6], = La +b], 
[a], *nlb], = Cab], 
也 就 是 说 加 与 乘 通 常 施 于 代表 元 素 上 ,不 过 结果 c 要 替换 成 其 类 的 代表 元 素 ( 即 x mod 
n)。 图 6-2(a) 给 出 了 Zs 上 的 十 ;运算 表 。 由 此 例 不 难看 出 : 
(1) Zz 上 的 加 法 十 , 是 封闭 的 , 即 Va. bEZ,.a+,b EZ, 
(2) 对 于 如 上 的 加 法 十 , ,元 素 0 扮演 着 “单位 元 ”的 角色 : 任何 元 素 加 上 0 仍然 为 该 
元 素 。 
(3) 相对 于 单位 元 0, 任 何 元 素 x 都 有 其 唯一 的 “ 逆 元 ”一 +。 例 如 ,在 Zs。 上, 元素 z=1 
关于 十 ,的 道 元 一 + 二 5, 而 元 素 x=2 的 加 法 逆 元 一 zx 一 4。 
利用 模 的 乘法 定义 ，, ,我 们 定义 集合 Z; : 它们 由 Z PRAS n 互 质 的 元 素 构 
成 , 即 


(6-22) 


Zi = { [a], € Z.: gdc(a, n) = 1) 
例如 Zi — (1. 2,4, 7, 8, 11, 13, 1). [8 6-2(b) 给 出 了 Zr; EIU + s le SER 


*[0 12345 “sji 2 4 7 8 11 13 M 
0fo 12345 i jt 2478 HM 
111234590 2/2 4 8 417 MH 13 
21234501 4 14 8 1 132 47 1 
3/3 4 $012 T |7 4234 N21 8 
4|[450 123 8 |8 1 2 H4 1D 1 7 
5|5 0123 4 u |n 7 42 Bi 8 4 

13 11 17 1 M8 4 2 

4 14 3 18 742 1 
(a) Zs 上 的 加 法 +6 运 算 表 (b) Z1s 上 的 乘法 ，1s 运 算 表 


6-2 Z, 上 的 加 法 和 乘法 运算 


由 此 例 可 见 : 

(1) Z 上 的 乘法 ，，, 是 封闭 的 , 即 Va, DEZ ,a* 加 EZ 。 

(2) 元 素 1 ARIK +, 的 “单位 元 ”, 即 VaEZ; ,a* ,l= 二 1 * ,a 二 a。 

(3) 相对 于 单位 元 1,Z; 上 的 每 个 元 素 x 都 有 其 唯一 的 “ 逆 元 ”x !。 例 如 ,2 让 上 元 素 
xz 一 2 关于 乘法 。is 的 逆 元 27 二 8, 而 元 素 7 WY Me WIC z= 二 13。 利 用 算法 EXTENDED- 
EUCLID 可 以 很 方便 地 计算 中 元 素 a 的 乘法 逆 元 素 : 由 于 a 与 HM. ik EXTENDED-GCD 
Cas 7 返回 的 (d, x. y WE: 

l=d=artitny 
这 蕴含 着 


ar 三 1 (modn) 


295 


从 算法 到 程序 (第 2 NO 


Bl zx 一 ca-:。 

作为 计算 乘法 逆 元 的 例子 ,假定 c=5,” 王 11。 那 么 EXTENDED-EUCLID(a, n) 返 回 (d， 
z, y)—(0,. —2, 1) ,所 以 1=5 + (一 2) 十 11 。1。 于 是 ,一 2( 即 9 mod 11) 是 5 关于 模 11 
的 乘法 逆 元 。 

在 本 章 其 余部 分 中 讨论 又 上 加 法 十 , 和 Zi 上 乘法 。, 时 ,习惯 地 把 等 价 类 表示 成 它们 
的 代表 元 素 ,而 将 运算 符 十 , A+, 分 别 表示 成 传统 的 算术 记号 十 和 。，。 此 外 ,关于 模 nn 相 
等 也 可 以 解释 为 Z, 中 的 等 式 。 例 如 ,下 列 两 个 语句 是 等 价 的 : 

ax = b (mod n) 
[a], *aLr], = b] 

Z; 中 元 素 a fll GEI WAAR GC! mod n), Z; 中 的 除法 用 等 式 a /b=ab™ (mod n) 
表示 。 例 如 ,在 Zi, A 77 — 13 (mod 15), 这 是 因为 7。13 =91=1 (mod 15), Hl 4/7— 
4 * 13—7 (mod 15), 

集合 Z; 的 元 素 个 数 用 p(z) 表 示 , 此 函数 称 为 Eule 的 phi 函数 ,满足 等 式 

ge) =nI I (1-1) (6-23) 
pln 

其 中 ,p 取 遍 所 有 整除 n 的 素数 (车 是 素数 ,也 包含 其 自身 ), 此 处 并 不 证 明 此 等 式 。 
直观 地 , 先 罗列 出 n 的 各 余数 {10， 1, tes nn 一 1} ,然后 对 每 一 个 整除 的 素数 2 ,删除 列表 中 
户 的 倍数 。 例 如 ,由 于 45 的 素数 约 数 是 3 和 5。 

9(45) 一 45(1 一 1/3)(1 一 1/5) 


— 45(2/3)(4/5) 

一 24 
E p 是 素数 , 则 Z; —(1. 2, =, p—1). H 

gp) = p—1 (6-24) 
H n 是 合 数 , 则 p(n) 二 n 一 1。 
6.4.2 解 模 线性 方程 

1. 问题 描述 与 分 析 
现在 来 考虑 求 下 列 方程 解 的 问题 

ax = b (mod n) (6-25) 


其 中 a>0.n>0. HE) SERA HIIS an. dk RSA 公 钥 密码 系统 中 将 其 作为 寻求 钥匙 过 
程 的 一 部 分 。 BGE a,b 和 nn 是 已 知 的 ,要 求 出 所 有 关于 模 满足 式 (6-25) 的 值 x。 可 能 有 
零 个 ,一 个 或 多 个 这 样 的 解 。 

首先 来 研究 式 (6-25) 有 解 的 条 件 ,有 定理 6-10。 

定理 6-10 ”对 未 知 数 为 zx 的 方程 cz = b (mod MAHAL gcd(a, n) | bs 

证 明 设 gcd(a, nn) 二 d 二 zx‘a 十 yn。 先 证 明 充分 性 ,4d15=> 3k, 使 得 6 二 kd。 而 由 此 得 
5 二 kd 二 k(xa 十 yn) 二 kx‘a 十 kyn。 这 意味 着 kx 是 方程 ax = b (mod nn) 的 一 个 解 。 

为 说 明 条 件 的 必要 性 , 设 x。 是 方程 az = b (mod n) ff] — fi — 3 yo HEE b= zoa 十 
yon, FHF dla 且 4d1n, 根 据 式 (6-9) 得 d|(zxoa 十 yon), BI d16。 
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为 在 式 (6-25) 有 解 的 条 件 下 ,寻求 解 的 方法 ,考察 下 列 几 个 命题 。 

定理 6-11 设 d=gedla. n), 并 假定 有 整数 x M y 使 得 d= 二 ax' +ny (例如 ,通过 
EXTENDED-EUCLID 的 计算 )。 若 d 上 5, 则 方程 az = b (mod n) 有 一 个 作为 它 的 解 的 值 , 满 
足 

xo = x' (b/d) mod n 
证 明 因为 有 
azro= ar'(b/d) (mod n) 
= d(b/d) (mod n) (因为 ar’ = d (mod n)) 
= b(mod n) 

于 是 ,zx 是 az b (mod n) 的 一 个 解 。 

定理 6-12 ”假定 方程 az = b (mod nn) 是 可 解 的 ( 即 d | 5, 其 中 d 二 gcd(a, n)) H. xy 是 
该 方程 的 一 个 解 。 则 此 方程 关于 模 恰 有 4d 个 不 同 的 解 x; 二 zo 十 i(n/d),i 二 0, 1,…， 
d 一 1。 

证 明 HT n/d>0 H 0i n/d) n.i—0. 1, …，d 一 1, 所 以 值 xo，, ntm ra RF 
Bin IQA A. HF xo 是 az = b (mod n) hft, A ax. =b (mod n)。 于 是 ,对 i 二 0， 
1，…，d 一 1, 有 

ax; =a (x, t+ in/d) 
— (aro t ain/d) 
=ax (mod n) (因为 d | a) 


=b(mod n) 
即 x; 也 是 解 。 
下 面 说 明 方程 wz = b (mod n) 的 任 一 解 x“, 必 与 这 d 个 解 中 的 一 个 关于 模 n 同 余 。 为 
此 ,首先 注意 到 对 V iq, 根据 定理 6-1 FER ki EZ, 使 得 i 二 kd 十 六 ,其 中 0<i d. ii 
zo + in/d= axo + C kd +i)n/d 


= xo +kdn/d +i'n/d 
= a +kn +i'n/d 
a i/n/d (mod n) 
这 说 明 YVJEZ,zo 十 jzz/d WY x; =x) in/dii—0. 1, d 一 1 之 一 关于 模 n FR. 
由 于 ax’=ax; (mod n). Mi gcd(a. n) 二 d, 根 据 推论 6-4, 有 x 三 zx; (mod n/d),i= 
0. 1,d 一 1, 所 以 x' 必 与 zo 十 in/d,i 二 0, 1, d 一 1 之 一 关于 模 n 同 余 。 


2. 算法 描述 与 分 析 


我 们 已 经 在 数学 上 解决 了 方程 az = b (nod iD ,下 列 的 算法 将 返回 该 方程 所 有 的 解 。 
输入 的 ac Alb 是 任意 的 正 整数 。 


MODULAR-LINEAR-EQUATION-SOLVER(a, b, n) 
1 (d, x, y) < EXTENDED-EUCLID(a, n) 

2 SØ 

3 ifd|b 

4 then zo<— x(b/d) mod n 
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for i — 0 to d—1 
do S«-SU (Cr, +i(n/d)) mod n ) 
7 return S 


算法 6-11 解 模 线性 方程 的 过 程 


作为 该 过 程 运行 的 一 个 例子 ,考虑 方程 14z = 30 (mod 1000 (这 里 ,a 二 14, b=30, n= 
100)。 第 1 行 调用 EXTENDED-EUCLID 得 到 (d, x, y)=(2, 一 7, 1) 。 由 于 2 | 30 ,执行 第 
4~7 53. EMS A 4p 3 E x — C77) (15). mod 100—95, HS 5 行 和 第 6 行 的 循环 得 出 两 个 
fit 95 和 45。 

it f MODULAR-LINEAR-EQUATION-SOLVER 的 运行 如 下 。 第 1 行 计算 d=gedla, n) 
以 及 两 个 整数 值 zx 和 y ,使 得 d 二 az 十 ny, 说 明 工 是 方程 axr = d (mod n) 的 一 个 解 。 若 d 
不 能 整除 5b, 则 根据 定理 6-10 方程 wz= b (mod nn) 无 解 。 第 3 行 检测 是 否 d | 0; 若 是 ,第 4 
行 按 定理 6-11 计算 方程 wz = b (mod n) 的 一 个 解 zo。, 有 了 一 个 解 ,定理 6-12 断言 其 余 
d—1 个 解 可 由 (mn/d) 关 于 模 n 的 倍数 而 得 。 第 5 行 和 第 6 行 的 for 循环 从 zo 开始 得 出 所 有 
d 个 解 。 

MODULAR-LINEAR-EQUATION-SOLVER 执行 O(lgn 十 gcd(a, nn)) 次 算术 运算 ,这 是 因 
为 EXTENDED-EUCLID 执行 O(lgn) 次 算术 运算 ,第 4 行 和 第 5 行 的 for 循环 的 每 次 迭代 执 
行 常 数 次 算术 运算 。 

定理 6-13 的 下 列 推论 给 出 了 a 与 模 n 互 质 的 特殊 情形 的 说 明 。 

推论 6-5 XHE— n2 1.36 gcd(a, 1) — 1. WI fé ax = b (mod n) 关 于 模 nn 有 了 唯一 
的 解 。 

车 5b 二 1, 这 是 常用 的 情形 ,所 求 的 xz 是 关于 模 的 a 的 乘法 逆 元 。 

推论 6-6 ”对 任 一 n> 1.4 gcdla, n)=1, WI FE ax = 1 (mod n) 关 于 模 n 有 唯一 的 
解 ; 否 则 无 解 。 


3. 程序 实现 
下 面 列 出 实现 算法 6-9 的 BigInt 版 本 。 


1 LinkedList * modularEquationSolver(BigInt a, BigInt b, BigInt n)í 
2 LinkedList * S=createList(sizeof(BigInt) , NULL) ; 

3 BigInt x0, x={NULL,0}, y={NULL,0}, i, 

4 d=extendedEuclid(a, n,&-x, &y). 

5 t=remainder(b,d) ,t],t2; 

7 if(isZero(t)){ 

8 t1—quotient(b. d) ;t2=product(x, tl); 

9 


x0=remainder(t2,n) ; /* x0--(b/d)x mod n* / 
10 for(clrBigInt(x) ,i=newIntByint(0) ;compareInt( &i, 8-d) 0; increase (8i 1)) ( 
11 clrBigInt( &11) ,clrBigInt( 8-12) ;clrBigInt( 8-0) ; 
12 t1—quotient(n, d) ,t2=product(i,tl) ,t= sum(x0, t2); 
13 x= remainder(t,n) ; / * x*-(x07- (n/d)i) mod n* / 
14 listPushBack(S, 8-3) ; /* SSU {x} */ 
15 ) 
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16 ) 

17 clrBigInt(&-y) ;clrBigIntC 8-x0) ;clrBigInt 8.8) ; 
18 clrBigInt (8-0 ;clrBigInt 8-t1) ;clrBigInt( 8-02) ; 
19 return S; 


程序 6-11 实现 算法 6-11 f C 函数 BigInt 版 本 


对 程序 6-11 的 说 明 如 下 。 

CD 与 算法 过 程 一 样 ,函数 modularEquationSolver 有 3 个 参数 a、b 和 n, 它 们 都 是 
BigInt 类 型 的 ,表示 模 方程 ax=b mod n 中 系数 a、 常 量 b 和 模 n。 函 数 返回 存储 该 方程 所 
有 解 的 链表 。 

(2) 变量 S xO x yd i 的 意义 与 算法 过 程 中 的 同名 变量 一 致 。 临 时 变量 tl 、t2、t 用 来 
接受 调用 大 整数 运算 函数 返回 值 ,防止 内 存 泄漏 。 

G) 第 4 行 调用 程序 6-8 定义 的 函数 extendedEuclid, 将 d 初始 化 为 a、n 的 最 大 公约 
数 , 并 将 x y 初始 化 为 d 关于 avn 的 线性 组 合 系数 。 第 5 行 调用 函数 remainder 计算 b KR 
VA d 的 余数 ,并 用 其 来 初始 化 临时 变量 t。 第 7 一 16 行 的 证 语句 对 应 算法 过 程 中 第 3 一 6 fT 
的 证 结构 。 检 测 的 条 件 是 调用 函数 isZero 的 返回 值 是 否 为 0。 此 函数 定义 在 源 文件 
bigint. c 中 ,原型 声明 为 


int isZeroCBigInt a); 


该 函数 判断 大 整数 a 是 否 为 0。 若是 ,返回 1, 和 否则 返回 0。 此 处 ,传递 给 参数 a 的 是 表示 bb 
除 以 d 的 余数 t,t 为 0 等 价 于 dlb。 若 此 条 件 成 立 , 第 8 行 和 第 9 行 完成 算法 中 第 4 行 的 操 
TE xo 7 x(b/d) mod n, $ 10—15 行 的 for 循环 调用 函数 newIntByint(0) 初 始 化 i 为 0, 循 
环 条 件 compareIntCi.d) <0 相当 于 i 二 d, 步 进 表达 式 调用 函数 increase(&i,1), 相 当 于 
i 十 十 。 循 环 体 中 ,第 11 一 14 FERRE rlro t i (n/d)) mod n。 第 15 行 完成 操作 S- 
SU {z})。 循 环 结束 时 ,S 内 存储 了 方程 的 所 有 解 。 

函数 modularEquationSolver 定义 于 numbertheory 文件 夹 中 的 源 文件 lequation. c. Jii 
型 声明 于 同一 文件 内 的 头 文件 lequation. h。 读 者 可 打开 文件 研读 实现 算法 6-11 函数 的 整 
型 数据 版 本 。 


6.4.3 THM 


如 同 对 给 定 的 元 素 a 自然 地 考虑 其 关于 模 n 的 倍数 一 样 ,自然 地 会 去 考虑 a 的 关于 模 
n 的 宕 构成 的 序列 ,其 中 ED : 
a^,a',a*, a3, + (6-26) 
Vin Ahi. JO 开始 ,此 序列 的 第 0 MEE a mod n—1. H8 i MA a; mod n。 例 如 ,以 
7 为 模 的 3 的 寡 是 


i 90.12 3 4 5 6 7 8 9 10 11 * 


3 md7 1 3 2 645 13 2 6 4 5-*- 
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而 以 7 为 模 2 的 宕 是 


i 0. 3..2 3 4. 5 6 $8 9 10 IL. 


2 mod7 1 2 4 12412412 4 -- 


1. 重复 B XA WEE 


数论 计算 中 的 一 个 经 常 发 生 的 操作 是 对 一 个 数 计算 以 另 一 个 数 为 模 的 寡 , 这 一 操作 称 
为 模 求 宗 。 更 准确 地 说 ,我 们 希望 有 一 个 计算 a^ mod n fA BOT IE HEP ab 是非 负 整数 ， 
n 是 正 整 数 。 模 求 宪 是 很 多 素数 检测 程序 的 基本 操作 。 将 b 表示 为 二 进 制 形式 ,可 有 效 地 
用 重复 平方 法 解决 此 问题 。 

a^ mod n 


设 b=bB* +h. BY) + +b B+ bo , 则 


" m 
a? — amB th BI en Btbo 
" ài 
= aP aea BU .gab Bab, 
" ri 
= qhB aea B gh Bab, 


= (ae )™ (aint )P™ oe (gh )8 (ah ) 


MODULAR-EXPONENTIATION(a, b, n) 
1 d-—1 

2. 设 (b.b4-1…b1bo) 为 5 的 B 进 制 表 达 式 
3 for i -— k downto 0 

4 do d < d" mod n 

5 if 57-0 

6 then d <-(d * a*i )mod n 

7 return d 


算法 6-12 重复 BUCH DE 


WE brs biis tm bis bo 是 的 二 进 制 表达 ( 即 二 进 制 表达 的 长 度 为 & 十 1, 入 是 最 高 位 ， 
bo 是 最 低位 )。 下 列 的 过 程 计算 a* mod noc 以 增 量 2 从 0 增加 到 b. 


MODULAR-EXPONENTIATION2(a , b, n) 


i dei 

2. B< b. bos m bis b> 为 5 的 二 进 制 表 达 式 
3 for i -— k downto 0 

4 do d < (d * d) mod n 

5 if5—1 

6 then d <- (d * a) mod n 

7 return d 


算法 6-13 EAFA 


每 次 迭代 中 的 第 6 行使 用 的 平方 计算 是 对 名 称 " 重 复 平方 ”的 解释 。 作 为 例子 ,对 a= 
7.0 一 561, 以 及 一 561, 算 法 所 计算 的 以 561 为 模 的 值 的 序列 展示 在 图 6-3 中 ;序列 的 指数 
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展示 在 标 有 c 的 行 中 。 
图 6-3 计算 a^ (mod z) 的 结果 ,其 中 a— 7. b=560=1000110000 以 及 n=561. d 行 展 
示 了 每 次 执行 for 循环 后 的 值 。 最 终结 果 是 1。 


i|l9 8 7 6 5 4 3 2 1 0 


CE 0 0 0 1 1000 0 


d | 7 49 157 526 160 241 298 166 67 1 
6-3 a’(mod nn) 的 结果 


变量 c 对 算法 而 言 并 不 是 必需 的 ,但 将 其 用 于 解释 之 便 ; 算 法 维护 下 列 包 括 两 部 分 的 循 
环 不 变量 。 

第 4 一 9 行 的 for 循环 每 次 重复 之 前 : c 的 值 与 5 的 二 进 制 表达 的 前 级 6b, bis ne 
bi Fils]. H. d—a* mod n. 

如 下 使 用 此 循环 不 变量 : 

初始 : 开始 时 ,一 A, 所 以 前 缀 灸 ,0 ，…，bit1 为 空 ,这 对 应 于 c 二 0。 此 外 ,d 二 1 二 a? 
mod n, 

维持 : 设 c 和 d' 表 示 for 的 每 次 重复 后 的 值 ,当然 也 是 下 一 次 重复 前 的 值 。 每 次 重复 
修改 co 一 2c (Fb, = 0) Bc’ 2e+1 (车 5 二 1) ,所 以 c 将 在 下 次 重复 前 是 正确 的 。 若 6b; 二 0， 
则 d’=d? mod n= (a°)? mod n=a™ mod na^ mod n, 若 b= 二 1, 则 d’=d?a mod n= (a*)*a 
mod n —a**! mod —a^ mod 2 无论 如 何 , 下 次 重复 前 都 有 d=a mod n. 

终止 : 终止 时 ,i 二 一 1。 于 是 ,c==6b, 这 是 因为 c 具 有 5 的 二 进 制 表 达 的 前 级 ,6b-1，…， 
bo 的 值 。 所 以 d —a* mod n=a’ mod n. 

如 果 输 入 a Lb 和 nn 是 二 进 制 8 位 数 , 则 所 需 的 算术 运算 次 数 为 O(B) 而 所 有 的 位 操作 次 
HON OCB"). 


2. 程序 实现 


B 进 制 数 的 模 竹 运算 ,与 二 进 制 的 模 短 运算 密 不 可 分 。 这 不 仅 是 因为 二 进 制 是 特殊 的 
B 进 制 ,更 微妙 的 是 可 以 通过 用 二 进 制 模 备 运 算计 算 算法 6-12 中 第 4 行 中 的 dq? 和 第 7 行 
中 的 d*。 所 以 ,在 实现 算法 6-12 之 前 , 先 实现 算法 6-13, 然 后 利用 前 者 实现 后 者 。 实 现代 
码 如 下 。 


1 unsigned long lg2(unsigned long long n){/ * 计算 n 的 二 进 制 位 数 * / 
2 unsigned long long x—1; 
3 unsigned long c—0; 
4 dof 

5 itd 

6 x=x<<l; 
7 }while(x<n); 

8 return c; 

9} 

10 static BigInt modularPow(BigInt a. long b. BigInt n){ 
11 longi, k—lg2(b) ,bi—- IL— —k; 
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12 BigInt d=newIntByint(1) .t={NULL,0} ,t1={NULL,0}; 
13 if(isOne(a)) 


14 return d; 

15 for(i=k;i>=1;i——){ 

16 clrBigIntC 8-0 ;clrBigInt 8-t1) ; 

17 t— product(d d) ;t1 — remainder(t, n) ;intAssign &-d. t1) ;/ * d<-d® mod n * / 
18 ifCb&-bi ( /[*4 b= 1% / 

19 elrBigInt(& t) ,clrBigInt(&-t1) ; 

20 t— product(d. a) ; 

21 tl=remainder(t, n); 

22 intAssign(&-d, t1) ; /* d<d*a mod n*/ 
23 } 

24 bi=bi>>1; /* 下 一 个 b*/ 
25 } 


26  clrBigInt 8-0) ;clrBigInt(&-t1) ; 

27 return d; 

28 } 

29 BigInt modularExponent(BigInt a, BigInt b. BigInt n) { 

30 long i,k=b. value-»n.x; 

31 BigInt d=newIntByint(1) ,t={NULL,0} ,tl={NULL,0}; 
32 ListNode * bi=b. value->nil->prev; 

33 ifCisOne(a)) 


34 return d; 

35  for(i-k;i —1;i— —)( /* 对 5 的 每 一 位 b;*/ 
36 clrBigInt(&.t); 

37 t=modularPow(d, Base,n) ;intAssign( &d,t); / * d<d® mod n * / 

38 x= * ((long * )(bi->key)); /*x—b*/ 

39 if(x) ( /* 8 b,40*/ 

40 clrBigInt(&t) ,clrBigInt( &-t1) ; 

41 t=modularPow(a,x,n) ;tl=product(d, t); 

42 clrBigInt(&d) ;d= remainder(t1l,n); / * d--d*a* mod n* / 
43 ) 

44 bi= bi-»prev; 

45 ] 


46  clrBigInt 8-0 ;clrBigInt 8-01) ; 
47 return d; 
48) 


程序 6-12 实现 算法 6-12 重复 BKH C 函数 


程序 6-12 的 说 明 如 下 。 

CD 第 1 一 9 行 定 义 的 函数 lg2 计算 并 返回 参数 n 的 二 进 制 表达 式 的 位 数 。 函 数 从 最 低 
位 c 王 0,x 一 2 起 计数 ,直至 x 宇 n。 返 回 c 即 为 所 求 。 

(2) 第 10 一 28 行 定义 的 函数 modularPow 实现 算法 6-13, 重 复 平方 计算 由 参数 a、b、n 
WE WIE a^ mod n, 
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函数 中 定义 的 变量 id bi 与 算法 过 程 中 的 同名 变量 意义 一 致 。BigInt 类 型 的 临时 变 
TÉ 是 进行 大 整数 算术 运算 时 为 防止 丢弃 匿名 BigInt 对 象 而 发 生 内 存 泄漏 作为 中 转变 
量 用 的 。 第 11 行将 上 初始 化 为 b 的 二 进 制 长 度 ,bi 初始 化 为 2* ,用 它 来 析 取 b 的 二 进 制 表 
达 式 中 的 最 高 位 。 第 12 行将 d 初始 化 为 1。 

第 13 行 和 第 14 行 处 理 底数 a 为 1 的 特殊 情形 。 此 时 ,无论 b 是 什么 数 , 寡 均 为 1。 第 
15 一 25 行 的 for 语句 ,对 应 算法 6-11 中 第 3 一 6 行 的 for 循环 。 其 中 ,第 16 行 和 第 17 行 调 
用 函数 product 和 remainder 完成 算法 中 的 d < (d * d) mod n 操作 。 第 7 行 检测 bi&b 是 
和 否 为 1, 相当 于 检测 b 的 第 i 位 是 否 为 1。 若 是 , 则 调用 函数 product 和 remainder 完成 d< 
* a mod n 操作。 第 24 行 执行 bi 右 移 1 位 的 操作 bi 二 bi 二 二 1, 相 当 于 每 次 重复 将 bi BR 
以 2。 

(3) 第 29—48 行 定 义 的 函数 modularExponent 实现 算法 6-12. 38 $2. B 次 方 计算 由 参数 
a b,n BERE a^ mod n。 由 于 算法 6-12 与 算法 6-13 DUE b 的 进位 制 表达 不 同 的 区 别 ,前 
者 是 B 进 制 ,后 者 为 二 进 制 。 所 以 . 仅 需 把 对 第 4 行 的 操作 从 d — (d * d) mod n 的 实现 换 
成 对 操作 d 一 d® mod n 的 实现 。 这 只 要 把 计算 gd. d 的 product 函数 调用 换 成 计算 ds 的 
modularPow 函数 调用 。 类 似 地 ,对 第 7 行 d <(d * a^ mod n 的 操作 用 函数 调用 modularPow 
和 product 来 实现 。 另 外 ,需要 调用 函数 isZero 来 实现 对 b 是 否 为 0 的 检测 。 代 码 的 说 明 ， 
与 (2) 的 说 明 非 常 相似 ,读者 可 对 照 研 读 。 

为 便于 代码 重用 ,程序 6-12 中 的 函数 声明 于 numbertheory 文件 夹 中 的 头 文件 
exponent. h 中 ,定义 于 同一 文件 夹 中 的 源 文件 exponent. c 中 。 在 这 两 个 文件 中 还 包含 实现 
算法 6-10 的 整 型 数据 版 本 ,读者 可 打开 文件 研读 。 


6.4.4 应 用 


青蛙 的 约会 


Description 

两 只 青蛙 在 网 上 相识 了 ,它们 聊 得 很 开心 ,于 是 觉得 很 有 必要 见 一 面 。 它 们 很 高 兴 地 发 
现 它们 住 在 同一 条 纬度 线 上 ,于 是 它们 约定 各 自 朝 西 跳 ,直到 碰面 为 止 。 可 是 它们 出 发 之 前 
忘记 了 一 件 很 重要 的 事情 , 既 没 有 问 清楚 对 方 的 特征 ,也 没有 约定 见面 的 具体 位 置 。 不 过 青 
蛙 们 都 是 很 乐观 的 ,它们 觉得 只 要 一 直 朝 着 某 个 方向 跳 下 去 ,总 能 碰 到 对 方 的。 但 是 除非 这 
两 只 青蛙 在 同一 时 间 跳 到 同一 点 上 ,不 然 是 永远 都 不 可 能 碰面 的 。 为 了 帮助 这 两 只 乐观 的 
青蛙 ,要 求 写 一 个 程序 来 判断 这 两 只 青蛙 是 否 能 够 碰面 ,会 在 什么 时 候 碰 面 ? 

把 这 两 只 青蛙 分 别称 为 青蛙 A 和 青蛙 B, 并 且 规 定 纬度 线 上 东经 0" 处 为 原点 ,由 东 往 
西 为 正方 向 ,单位 长 度 lm, 这 样 就 得 到 了 一 条 首尾 相 接 的 数 轴 。 设 青蛙 A 的 出 发 点 坐标 是 
,青蛙 B 的 出 发 点 坐标 是 >。 青蛙 A 一 次 能 跳 mm, FE B 一 次 能 跳 zm, 两 只 青蛙 跳 一 次 
所 花费 的 时 间 相同 。 纬 度 线 总 长 Lm。 现 在 要 求 出 它们 跳 了 几 次 以 后 才 会 碰面 。 

Input 

输入 只 包括 一 行 5 32 r, ym n, L, HP x y< 2000000000, 0 — m, n< 
2000000000 ,0— L — 2100000000 , 
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Output 
输出 碰面 所 需要 的 跳跃 次 数 , 如 果 永远 不 可 能 碰面 则 输出 一 行 


"Impossible" 
Sample Input 
12345 


Sample Output 


4 

1l. 问题 分 析 

如 图 6-4 所 示 为 周 长 为 的 纬 线 。 青 蛙 A Mx Ab AR Th DU AE BE mm, PRE B A y 处 自 
东 向 西 每 跳 wm。 两 只 蛙 同 时 起 跳 .周而复始 ,或 s 


许 ANB He Aes SE ALB IRAE MA FE 


会 相遇 。 若 能 相遇 , 找 出 第 一 次 相遇 时 两 蛙 掉 
过 的 次 数 = 并 输出 ,否则 输出 不 能 相遇 的 信息 图 64 两 只 青蛙 在 同一 条 纬 线 上 
Impossible。 设 两 蛙 跳 = 次 后 相遇 , 则 有 zx 十 mz 三 自 东 向 西 跳跃 
ytnz mod L, BJ 

(m—n)z = y— x mod L 
4 a=m—n mod L.b=y—x mod 工 , 则 上 式 为 

az — b modL 

根据 定理 6-15,gcd(a, L) | b 是 本 问题 有 解 的 充分 必要 条 件 。 有 解 时 ,最 小 正 数 解 即 为 
所 求 。 


2. 程序 实现 

将 上 述 解 题 思想 实现 为 如 下 的 C 程序 。 

1 int mainO( 

2 long long x. y; m, n, L, min, a, b. d; 

3 LinkedList * s; 

4 ListNode * p; 

5 FILE * f1— fopenC"chap06/7f kt 4 2 /inputdata. txt" ,"r") 

6 * {2=fopen("chap06/¥¥ kE #4  /outputdata. txt" ,"w") ; 

7 assert(f18.8.f2) ; 

8  fscanf(fl, "%d %d 96d Md Vid", &x, &y, &m, &n, &L); 
9 a= mod(m—n, L); b= mod(y— x. L); d=ged(a, L); 

10 if(b%d){ /*d b 无 解 */ 
11 ÍprintfCf2, "Impossible\n") ; 

12 return 0; 

13 ) 


14  s—modularLinearEquationSolver(a. b, L) ; 
15  min-LONG MAX; 
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16 p-s-»nil-»next; 

17 while(p!=s->nil){ /* 寻找 最 小 解 * / 
18 if(min> * (long long * )(p->key)) 

19 min= * (long long * )( p-^key) : 

20 p=p->next; 

21 ) 

22  fprintfCf2, "%d\n",min) ; 

23  fclose(f1) ;fcloseCf2) ; 

24 return 0; 

25 } 


程序 6-13 ”解决 青蛙 的 约会 问题 的 C 程序 


对 程序 6-13 的 说 明 如 下 。 

d) 变量 x、y、m、n\L 分 别 用 来 表示 青蛙 A 和 B 的 起 跳 位 置 , 一 次 跳跃 的 距离 及 纬 线 
周 长 。 变 量 a、b、d 分 别 表示 要 解 的 模 线 性 方程 az=b mod L 的 系数 及 a, L 的 最 大 公约 数 
gcd(a, L)。 变 量 min 用 来 跟踪 方程 的 最 小 解 。 指 针 s 用 来 指向 存放 方程 解 的 链表 ,而 指针 
p 用 来 扫描 s 中 的 结 点 。 

(2) 第 8 行 从 输入 文件 中 读 取 x、y、m.n 和 工 的 值 。 第 9 行 计算 模 线性 方程 az=b mod L 
的 系数 a 为 m 一 n mod L, b JJ y— x mod Le iii d Jj ged(a, L). H 10—13 行 根据 定理 6-10 检 
测 该 方程 是 否 无 解 。 对 有 解 的 情形 ,第 14 行 调用 函数 modularLinearEquationSolve 解 该 线性 
方程 。 第 15 一 21 行 扫描 存放 在 s 指向 的 链表 中 的 解 ,跟踪 最 小 者 min。 第 23 行将 解 写 入 
输出 文件 。 

(3) 第 14 行 调用 的 函数 modularLinearEquationSolve 是 实现 算法 6-11 的 整 型 数据 版 
本 ,该 函数 定义 于 文件 夹 numbertheory 中 的 源 文件 lequation. c 中 ,原型 声明 于 同一 文件 夹 
的 头 文件 lequation. h 中 ,读者 可 打开 文件 研读 。 


6.5 素数 检测 


本 节 中 ,来 考虑 寻求 大 素数 的 问题 。 从 讨论 合 数 的 判断 方法 开始 ,进而 研究 素数 的 密 
度 , 接 着 考察 一 个 可 靠 但 不 完整 的 检测 方法 ,然后 介绍 一 个 由 Miller 和 Rabin 提出 的 有 效 
的 随机 素数 测试 法 。 


6.5.1 伪 素 数 检测 


引 理 6-4 7 为 正 整 数 ,Z; = 二 {zi ,zs，… ,zpw}。 Va€Z; ,序列 
Z1d» 22d» tU. Fem 
XT n 是 序列 
的 一 个 排列 。 
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WEBB 由 于 gcd(a, nn) 二 1, 故 不 存在 整数 i(i 二 1,2,…,g(n),) 使 得 za =0 (mod n), 
这 意味 着 所 有 zia (i 二 1,2,… ,p(n),) 均 与 序列 = ,zs，… ,zpow 中 之 一 元 素 关于 模 n AR, 
下 证 诸 za ,i 二 1,2,… ,9p(m) 关 于 模 n 两 两 不 同 余 。 若 不 然 ,有 1 二 i,j 三 gq(n), 且 iA; 而 使 
得 za 三 zja (mod n)。 由 于 gcd(a, 2) 王 1, 根 据 推论 6-4 Al z;— 2; (mod iD ,这 是 一 个 矛盾 。 
结论 因此 得 证 。 

定理 6-13(Euler 定理 ) 对 任 一 整数 n1. PER a€ Z; 

a®” = ] (mod n) 
其 中 ,p(x) 是 6.4.1 节 定 义 的 Eule 的 phi 函数 。 

证 明 根据 引 理 6-4 ,序列 zna, zza, s zgwa XT BE n 是 序列 = ,zz ，… ,zgow 的 一 个 
排列 。 所 以 ,根据 式 (6-6) 有 ma * zza * zgana =z tz 
Zen) F9 m *ozjUtmQ) (modz)。 由 于 gcd((z。z…zrxo)，z2) 一 1, 根 据 推论 6-4 有 
a®” =] (mod n), 

推论 6-7(Fermat 定理 ) £i p 是 素数 , 则 对 任意 的 a€ z; 

a^! =1 (mod p) 

此 推论 适用 于 Z, 中 除了 0 以 外 的 每 个 元 素 , 这 是 因为 EZ . PIC. p 为 素数 ,对 所 
AI a€Z,(aA0), a^ a (mod p). 

利用 Fermat 定理 ,来 考虑 一 个 “基本 能 工作 ”的 素数 检测 方法 ,事实 上 这 个 方法 在 很 多 
实际 应 用 中 是 够 好 的 了 。 对 消除 此 方法 中 小 毛病 的 更 精练 的 算法 将 在 稍 后 介绍 。 设 ZR 
m Z, 中 的 非 零 元 素 : 


“zan (mod n), Bll ar™ Cz, * z+ 


Z,*-—110.2.-,n—1) 
车 n 是 素数 , 则 Z, + =Z," 
MER n 是 基 一 a 的 伪 素 数 , 若 
a"! = ] (mod n) (6-27) 
Fermat 定理 (推论 6-7) 蕴 含 着 车 n 是 素数 , 则 Z,* 中 的 每 一 个 元 素 a、n 都 满足 
式 (6-27)。 于 是 ,车 能 找到 一 个 a 使 得 不 满足 式 (6-27), 则 n 必 是 合 数 。 令 人 惊讶 的 是 ， 
反之 几乎 成 立 。 所 以 此 判断 标准 几乎 是 完美 的 素数 测试 。 检 测 n 对 a = 2 是 否 满足 
式 (6-27): 如 果 不 满足 ,断定 它 是 合 数 ,否则 ,输出 是 素数 的 猜想 (事实 上 ,此 时 知道 要 
么 是 素数 ,要 么 是 一 个 基 -2 的 伪 素 数 )。 
下 列 的 过 程 按 此 种 方式 检测 n 是 否 为 素数 。 它 利用 6. 4. 4 节 的 过 程 MODULAR- 
EXPONENTIATION。 输 入 的 假定 是 一 个 大 于 2 的 奇数 。 


PSEUDOPRIME(n) 

1 if MODULAR-EXPONENTIATION(2, n—1, n)=1 (mod n) 
2 then return PRIME 上 > 我们 希望 

3 else return COMPOSITE 上 > 明确 地 


算法 6-14 利用 Fermat 定理 的 伪 素 数 判定 过 程 


这 个 过 程 只 在 一 种 情况 下 可 能 会 出 错 。 也 就 是 说 ,车 它 说 是 合 数 , 则 它 总 是 对 的 。 但 
车 它 说 nn 是 一 个 素数 ,而 是 一 个 基 -2 的 伪 素 数 时 就 产生 一 个 错误 。 
该 过 程 出 错 的 机 会 有 多 少 呢 ? 出 奇 的 少 。 小 于 10000 的 nn 中 只 有 22 个 值 会 发 生 错误 ; 
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最 先 的 4 个 值 是 341、561、645 和 1105。 可 以 证 明 , 当 p>o2 时 ,该 程序 运行 于 随机 8 二进制 
位 整数 出 错 的 概率 趋 于 零 。 出 于 实用 的 考虑 ,如 果 在 一 些 应 用 中 仅仅 是 寻求 一 个 大 素数 , 则 
随机 地 选择 大 整数 并 调用 PSEUDOPRIME 直至 对 所 选 整数 输出 “素数 ”为 止 几乎 绝 不 出 错 。 
车 所 测试 的 整数 不 是 随机 选取 的 ,需要 有 更 好 的 素数 检测 方法 。 
不 幸 的 是 ,不 能 对 接 下 来 的 基数 (例如 ,a 二 3) 完 全 估计 出 直接 检测 式 (6-27) 的 错误 , 因 
为 存在 对 所 有 的 a €Z, 满足 式 (6-27) 的 合 数 ,这 样 的 整数 称 为 Carmichael 整数 。 开 头 的 
3 个 Carmichael 是 561,1105 和 1729, Carmichael 数 非 常 稀少 ;例如 ,只 有 255 个 小 于 
100000000 的 Carmichael 数 。 下 面 说 明 如 何 改进 素数 检测 方法 使 得 不 会 被 Carmichael 数 
BH. SAU PRS: 
设 sgEZ; , 若 序列 
gh V gf 
关于 模 n 是 序列 
TZ1 9， 之 2 9 s Zon) 
的 一 个 排列 , 则 称 g 是 Z; 的 一 个 原 根 。 
例如 ,3 是 以 7 为 模 的 一 个 原 根 ,但 2 不 是 。 不 是 对 任意 的 正 整数 nn,Z; 都 有 原 根 。 我 
们 不 加 证 明 地 给 出 定理 6-14, 它 指出 了 使 得 Zz 存在 原 根 的 正 整数 ”的 特征 。 
定理 6-14 使 Z; Ht ERR EE (n> D JE 2.4. p L2 pr Hop p EXT 2 的 任意 
素数 ,e 是 任意 的 正 整数 。 
Tig EZ. 的 一 个 原 根 且 a EZ; 的 任 一 元 素 , 则 存在 一 个 = 使 得 g*= a modna). It 
z 称 为 以 n 为 模 a 的 对 基底 g 的 离散 对 数 或 4a 的 指数 ;将 此 值 表示 为 ind,,e(a) 。 
定理 6-15( 离 散 对 数 定理 ) Fg 是 Z; 的 一 个 原 根 , 则 等 式 g= g*(mod n) 成 立 当 且 
仅 当 等 式 zx = y (mod nD IK YE, 
证 明 首先 假定 zx 三 y (mod g(n)), 则 有 某 整 数 上 ,使 得 ZX 三 y 十 kp(n)。 所 以 ， 
g'- g*™ (mod n) 
g'*(g*")* (mod n) 
g * (mod n) (根据 Euler’ 定理 ) 
= g'(mod n) 
反之 ,假定 g^ — g' (mod n)。 因 为 g REY PUE Z; 中 所 有 元 素 构 成 序列 的 一 个 排列 ， 
所 以 , 若 g*— g? (mod n) WUA r=y (mod eG). 
离散 对 数 能 简化 模 等 式 的 便利 之 处 示例 于 定理 6-16 的 证 明之 中 。 
定理 6-16 E pE- NARH e 三 1, 则 方程 
x? — ] (mod 5) (6-28) 
有 且 仅 有 两 个 解 , 即 z=1 和 xz 一 一 1。 
证 明 设 n=p*。 定 理 6-14 蕴含 着 Z; 有 一 个 原 根 g。 式 (6-28) 可 以 写成 


(gt, 0 )? = g”ine (mod n) (6-29) 
注意 ind,,, (D) =0, 4E FH 6-15 意味 着 式 (6-29) 等 价 于 
2 + ind,,, Cx) = 0 (mod gGD) (6-30) 


为 解 此 方程 中 的 未 知 数 ind,,s (a ,运用 6. 4. 节 中 的 方法 。 根 据 式 (6-23) 有 p(n) = 
pP (0—1/p) — Cp— DD pt! it d—gcd(2. e(1) —gced(2. (p 一 1) p”'!) 二 2, 并 注意 d |0, 
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由 定理 6-12 知道 式 (6-30) 恰 有 4 —2 个 解 。 所 以 , 式 (6-28) 恰 有 2 个 解 ,观察 可 得 r—1 和 
Z 一 一 1 。 

数 工 是 以 n 为 模 1 的 一 个 非 平 凡 平方 根 , 若 它 满足 方程 x? 圭 1 (mod n) fA x Xin 而 
言 , 既 不 等 价 于 1 也 不 等 价 于 一 1。 例 如 ,6 是 以 35 为 模 的 1 的 非 平凡 平方 根 。 推 论 6-8 将 
用 于 6.5.2 节 中 的 Miller-Rabin 的 素数 测试 过 程 的 正确 性 证 明 。 

推论 6-8 ETEL n HR 1 的 非 平凡 平方 根 , 则 n 是 合 数 。 

证 明 根据 定理 6-16 的 逆 否 命题 , 若 存 在 以 为 模 1 的 非 平 凡 平方 根 , 则 不 可 能 是 
一 个 奇 素数 或 奇 素数 的 寡 。 若 x= l (nod 2). W x = 1 (nod 2), 所 以 ,以 2 为 模 1 的 所 有 
平方 根 都 是 平凡 的 。 于 是 ,n 不 可 能 是 素数 。 最 后 ,对 1 的 非 平 凡 平方 根 , 必 有 n1. BIA. 
n DG. 


6.5.2 Miller-Rabin 的 随机 素数 检测 


Miller-Rabin 的 素数 检测 在 以 下 两 个 方面 做 了 修改 后 克服 了 PSEUDOPRIME 简单 检测 
的 问题 。 

CD 它 要 进行 若干 次 随机 选 定 的 基 值 的 测试 ,而 不 仅仅 是 对 一 个 基 值 进行 。 

(2) 在 计算 每 一 个 模 求 舞 的 同时 , 它 关 注 是 否 在 最 后 的 平方 集合 中 发 现 以 为 模 的 1 
的 一 个 非 平凡 平方 根 。 若 是 , 则 停止 并 返回 COMPOSITE, HEW 6-8 证 明 在 此 方式 中 检测 
到 的 是 合 

Miller-Rabin 的 伪 码 做 如 下 素数 检测 。 输 入 (x 二 2) 是 一 个 被 测试 的 奇数 ,s 是 要 随机 选 
取 的 用 于 测试 的 基 值 个 数 。 代 码 利 用 随机 数 发 生 器 RANDOM, n 一 1) 返 回 一 个 满足 1 
a SKn—1 的 整数 a。 代 码 还 利用 一 个 辅助 过 程 WITNESS. fili 7 WITNESS(a, n) 为 TRUE 当 
HAM a ÆR Bn 的 一 个 “证 词 ”, 即 车 a 可 能 作为 n 是 合 数 的 一 个 证 明 ( 以 我 们 将 看 到 的 方 
式 )。WITNESS(a, n) 是 测试 

a"! zÉ ] (mod n) 

的 一 个 扩展 但 比 它 更 有 效 ,而 该 测试 形成 PSEUDOPRIME 的 一 个 基 ( 用 a 二 2)。 先 介绍 说 明 
WITNESS 的 构建 ,然后 说 明 它 是 如 何 用 于 Miller-Rabin 的 素数 检测 的 。 设 一 1=2% ,其 中 
1 三 1 H 是 一 个 奇数 , 即 n 一 1 的 二 进 制 表示 是 奇数 u 的 二 进 制 表示 后 跟 1 个 零 。 所 以 ， 
a^^! = (a*)* (mod n) ,于 是 可 以 通过 计算 a" mod n 并 连续 地 求 1 次 平方 来 计算 oa mod a. 

WITNESS(a, 7) 

1 设 * 一 1=2x ,其 中 上 三 1 Au 是 奇数 

2 zo MODULAR-EXPONENTIATION(a, u, n) 

3 for ix-1 tor 

4 do z,4—7;., mod n 
5 if z,—1Hz-:x1H ri- 天 nm 一 1 
6 then return TRUE 
7 ifzl 
8 then return TRUE 
9 return FALSE 


算法 6-15 提供 合 数 证 据 的 过 程 
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此 WITNESS 伪 代 码 通过 在 第 2 行 计 算 值 zo 二 a* mod ,然后 通过 第 3 一 6 行 的 for 循环 
将 此 结果 做 1 次 平方 来 计算 a”! mod n。 通 过 对 i 的 递 推 ,计算 所 得 的 值 序列 ze nans 
x, 满足 等 式 2 ma?" (mod n) ,i 二 0, 1,，…, 1。 特 殊 地 ,有 zx, 三 a”! (mod n)。 只 要 执行 了 第 
4 行 的 平方 运算 , 若 在 第 5 行 和 第 6 行 中 检测 到 1 的 一 个 非 平凡 平方 根 ,循环 就 会 提前 终 
止 。 如 果 是 这 样 ,该 算法 停止 并 返回 TRUE. 在 第 7 行 和 第 8 PRIA x =a"! (mod 
nn) 不 等 于 1, 如 过 程 PSEUDOPRIME 返回 COMPOSITE 那样 返回 TRUE。 如 果 没 有 在 第 6 行 
或 第 8 行 返回 TRUE, WEH 9 行 返回 FALSE。 

现在 认为 ,车 WITNESS, 2) 返回 TRUE, 则 用 a 构造 了 一 个 为 合 数 的 证 据 。 

如 果 WITNESS 由 第 8 行 返回 TRUE, 则 它 发 现 a™ mod n E 1, Hn JE ECL AR 
Fermat 定理 (推论 6-7) ,对 所 有 的 a€ Z, ^ .a" Œl (mod 2z)。 所 以 不 可 能 是 素数 ,上 且 式 子 
a"^! mod n 天 1 是 此 事实 的 一 个 证 明 。 

若 WITNESS 由 第 6 行 返回 TRUE, 则 它 发 现 x;_1 是 以 nn 为 模 ,x; 二 1 的 一 个 非 平凡 平 
方 根 ,这 是 因为 c =+1 (mod n) A c; 2; *—1(nod n)。 推 论 6-8 断言 仅 当 是 一 个 
合 数 时 , 才 可 能 有 以 n 为 模 的 1 的 非 平凡 平方 根 。 所 以 ,是 以 为 模 的 1 的 一 个 非 平凡 平方 
根 的 实例 是 ”为 合 数 的 一 个 证 明 。 

这 样 就 完成 了 WITNESS 的 正确 性 的 证 明 。 若 调用 WITNESS(a, ndih tli TRUE, W n 4 
RERA H n 是 合 数 的 证 明 可 很 容易 地 由 a 入 确定。 

现在 来 考察 基于 WITNESS 的 Miller-Rabin 的 素数 检测 。 在 此 假设 是 一 个 大 于 2 的 
奇数 。 


MILLER-RABIN(n, s) 


1 forj<—l1tos 

2 do a < RANDOM(1, n—1) 

3 if WITNEsS(a, n) 

4 then return COMPOSITE b E X 

5 return PRIME 户 几 乎 肯定 


算法 6-16 检测 素数 的 随机 算法 过 程 


过 程 MILLER-RABIN 是 对 n 是 合 数 的 证 词 的 随机 搜索 。 主 循环 (从 第 1 行 开始 ) 从 Z,* 
中 选取 随机 值 (第 2 行 )。 若 选取 的 a 中 有 一 个 是 合 数 的 证 词 , 则 MILLER-RABIN 在 第 4 
行 输出 COMPOSITE。 根 据 WITNESS 的 正确 性 ,这 样 的 输出 总 是 对 的 。 若 在 s 次 尝试 中 没 
有 发 现 证 词 ,MILLER-RABIN 因此 假定 没有 证 词 被 发 现 .并 假定 是 素数 。 将 看 到 , 当 s 足 
够 大 时 ,此 输出 很 可 能 是 正确 的 。 然 而 ,在 很 小 的 机 会 中 ,该 过 程 会 不 幸 地 在 其 所 选 的 a 中 
没 发 现 证 词 但 却 存 在 有 证 词 。 

为 示例 MILLER-RABIN 的 操作 , 设 n 是 Carmichael 数 561. r EJ à — 1— 560 — 24 * 5, 
假定 a—7 并 将 其 选 为 基 , 图 6-3 展示 了 WITNESS 计算 x= a? — 241 (mod 561) ,并 由 此 
计算 出 序列 X=<241, 298, 166, 67, 1 过。 于 是 ,由 于 a= 67 (mod n) 及 a” — 1 (mod 
1) ,在 最 后 一 次 求 平方 步骤 中 发 现 一 个 1 的 非 平凡 平方 根 。 所 以 ,是 为 合 数 的 一 个 证 词 ， 
WITNESS(7, n) 返回 TRUE. H. MILLER-RABIN 返回 COMPOSITE., 

若 n 是 一 个 8 二进制 位 整数 ,MILLER-RABIN 需要 0(s8) 次 算术 运算 和 0(s83) 次 位 运 
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算 ,这 是 因为 它 渐进 地 需要 不 超过 s 次 模 求 宕 运算 。 
6.5.3 Miller-Rabin 素数 检测 的 错误 率 


若 MILLER-RABIN 输出 PRIME, 则 有 一 个 很 小 的 出 错 机 会 。 不 像 PSEUDOPRIME th} £i 
的 几率 独立 于 ;对 此 过 程 而 言 ,没有 坏 的 输入 。 相 反 , 它 依赖 于 s 的 大 小 和 选取 基 值 a 时 的 
“运气 ”。 由 于 每 次 对 式 (6-27) 的 检测 更 严格 ,可 以 按 通 常 的 理由 期 望 对 随机 选择 的 整数 
错误 率 应 当 是 很 小 的 。 定 理 6-17 提供 了 更 准确 的 论据 。 

定理 6-17 若是 一 个 奇 合 数 , 则 是 合 数 的 证 词 个 数 至 少 为 (n 一 1)/2。 

定理 6-18 ”对 任意 的 奇 整数 nn 二 2 和 正 整数 s, MILLER-RABIN(n,;s) 出 错 的 概率 至 多 
HÀ 27. 

WEBB 利用 定理 6-17 ,我们 知道 车 是 一 个 合 数 , 则 算法 6-16 第 1 一 4 行 得 for 循环 的 
每 次 执行 至 少 以 1/2 的 概率 发 现 一 个 n 为 合 数 的 证 词 。MILLER-RABIN 只 可 能 在 其 主 循环 
的 所 有 的 ;次 重复 中 都 不 幸 地 没有 发 现 n 是 合 数 证 词 的 情况 下 才 出 错 ,这 样 的 一 串 错 误 的 
概率 为 2 一。 

于 是 ,选择 ;二 50, 就 几乎 能 满足 任意 可 想象 的 应 用 。 


6.5.4 程序 实现 


l. 随机 数 发 生 器 


算法 6-16 的 MILLER-RABIN 过 程 运行 时 ,需要 调用 随机 数 发 生 器 RANDOM 产生 一 个 
落 于 区 间 [1, ”一 1) 内 的 随机 整数 。C 语言 提供 了 一 个 库 函 数 rand(), 它 声明 于 头 文件 
stdlib. h 中 。 调 用 该 函数 产生 并 返回 一 个 落 于 区 间 [0, RAND_MAX] 内 的 随机 整数 。 因 
此 ,需要 改造 该 函数 ,使 得 能 对 任意 大 整数 n, 产 生 一 个 介 于 0~n 一 1 之 间 的 整数 。 为 此 , 先 
定义 如 下 函数 。 

1 typedef unsigned long long ul int; 

2 typedef long long ] int; 

3 ul int RangedRandom( ul int min, ul int max) { 

4  ulint u—(double) randO/CRAND MAX-- D) * (max— min) + min; 


5 return u; 
6} 


程序 6-14 产生 介 于 给 定 的 两 个 整 型 数据 min 和 max 之 间 的 随机 整数 的 C 函数 
对 由 unsigned long long 型 参数 min .max( 前 者 小 于 后 者 ),RangedRandom 函数 调用 
rand() 产 生 一 个 L[0, RAND_MAXj] 之 间 的 整数 ,转换 成 double 类 型 后 除 以 RAND_MAX+ 
1 后 得 到 一 个 介 于 [0, 1) 的 double 型 随机 数 。 用 此 数 乘 以 (max 一 min) 并 加 上 min 就 得 到 
一 个 介 于 [min, max) 的 随机 数 ,将 其 整数 部 分 作为 函数 值 返回 。 利 用 该 函数 ,对 任意 指定 
的 大 整数 a 可 定义 下 列 的 产生 介 于 [0, a) 之 间 的 随机 整数 的 函数 。 
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1 BigInt random(BigInt a) { 
2 BigInt b= (createList(sizeof long) NULL) .0) ; 

3  ListNode * p—a. value-»nil-»next; /*a 的 最 低位 */ 

4 long x; 

5 assert(a. sign— —0); 

6  srand( time(NULL) ); 

7 x-—RangedRandom(l, * ((long* )(p->key)));/* 产 生 b 的 最 低位 * / 
8 listPushBack(b. value, &-x) ; 

9 


p=p->next; 


10 while(p! =a. value-»niD ( /* 自 低 向 高 产生 b 的 每 一 位 * / 
11 x=RangedRandom(0, * ( (long * )(p->key))); 

12 listPushBack(b. value, 8-x) ; 

13 p=p->next; 

14 j 

15  p-b.value-»nil-»prev; / * 从 b 的 最 高 位 起 去 除 高 位 0*/ 
16  while(p!—b. value-»nil-»next&-8-( * (ong * )(p->key)) 一 一 0)){ 

17 listDelete(b. value, p) ; 

18 p=b. value-»nil-»prev; 

19} 

20 return b; 

21} 


程序 6-15 ”产生 随机 大 整数 的 C 函数 


对 程序 6-15 的 说 明 如 下 。 

(1) 函数 random 产生 一 个 介 于 O~a 之 间 的 随机 BigInt 型 大 整数 ,并 返回 。 

(2) 函数 中 设置 BigInt 型 变量 表示 要 创建 随机 数 ,ListNode 型 指针 p 用 来 访问 表示 a 
的 绝对 值 每 一 位 数 的 链表 结 点 。long 型 变量 x 用 来 存放 所 产生 的 随机 数 的 每 一 位 数 。 

(3) 第 7 行 调用 函数 RangedRandom(1. * ((long* )(p->key))) 产 生 介 于 0 一 p 指向 
的 a 的 最 低位 之 间 的 随机 数 x, 第 8 行 调用 listPushBack(b. value,&x) 将 x 作为 b 的 最 低 
位 。 第 10—14 行 的 while 循环 逐 位 产生 介 于 0—2 的 当前 位 的 随机 数 ,作为 b 的 当前 位 。 由 
于 所 产生 的 随机 数 可 能 为 0, 第 15 一 19 行 负责 去 除 b 的 高 位 0。 


2. 素数 检测 


算法 6-16 的 MILLER-RABIN 过 程 运行 时 需要 调用 算法 6-15 的 WITNESS 过 程 为 a 是 合 
数 提供 证 词 。 下 列 函 数 实现 WITNESS 过 程 。 


1 int Witness(BigInt a, BigInt n){ 
BigInt u= { NULL, 0} .x0. xi= (NULL.0) . tow=newIntByint(2) ,nl= {NULL,0}; 
long r:t—0.i; 
intAssign( 8-u. n) decrease ( 8-u. 1) ;intAssign( &-n1 0) ;/ * unl 初始 化 为 n 一 1x* / 
dol 

ttt; 

dividedByDigit(u. value, 2, 8.) ; 
) while(! isZeroCu) &&-! r) 


0 - O c & o t 
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9  x0—modularExponent(a. u, n); 
10 for(i=1;i<=t;i++){ 


11 clrBigIntC 8-xi) ; 

12 xi— modularExponent( x0 , tow. n) ; 

13 if(isOne(xi) 8&1. isOne(x0) & &comparelnt( 8x0, &-n1) ) 
14 return 1; 

15 intAssign( & x0, xi) ; 

16 j 

17 if(lisOne(x)) 

18 return 1; 


19 return 0; 
20 } 


程序 6-16 ”实现 算法 6-15 的 C 函数 BigInt 版 本 


对 程序 6-16 的 说 明 如 下 。 

(1) 函数 Witness 实现 算法 6-15 的 WITNESS 过 程 ,对 参数 n 表示 的 整数 判断 由 参数 a 
提供 的 n 为 合 数 证 词 是 否 正确 。 若 a 足以 证 明 n 是 合 数 ,函数 返回 1, 否 则 返回 0。 

(2) 函数 中 设置 的 变量 u、t、x0、xi 与 算法 过 程 中 的 同名 变量 意义 一 致 。nl 用 来 表示 
n—l. 

G) 第 5 一 8 行 通过 一 个 do-while 循环 实现 算法 中 的 第 1 行 ,将 n 一 1 分 解 为 2u。 在 循 
环 体 中 ,累加 2: 的 指数 t, 调 用 函数 dividedByDigit(u. value,2,&i) 计 算 u( 第 4 行 初始 化 为 
n 一 1) 除 以 2 的 商 。 该 函数 定义 于 源 文件 bigint. c 中 。 注 意 ,其 中 的 第 1 个 参数 是 u 的 成 员 
value, 商 就 地 存储 于 value 中 。 第 3 个 上 参数 是 用 来 保存 余数 的 。 循 环 的 条 件 是 u 二 1 且 
r=0, 

第 9 行 调用 程序 6-16 定义 的 函数 modularExponent (a. u, n) 执行 操作 zo 一 
MODULAR-EXPONENTIATION(a. u, 7) ,第 10 一 16 行 的 for 语句 对 应 算法 过 程 中 第 3 一 6 
行 的 for 循环 ,迭代 计算 xi。 第 13 行 调用 函数 isOne(xi) ,isOneC x0) 和 comparelnt(&.x0, 
&nl) 检 测 条 件 x; =1 H zi_1 关 1 H rinl, KÆ isOne 和 compareInt 定义 于 源 文件 
bigint. c 中 ,分 别 用 来 判断 大 整数 的 值 是 否 为 1, 即 比较 两 个 大 整数 的 大 小 关系 。 


1 int MillerRabin(BigInt n. int s){ 
2 Biglnt a= (NULL.0) ; 
3 intj; 

4 for(j=0;j<s;j++){ 
5 clrBigInt( &-a); 

6 a—random(n) ; 

; if( Witness(a,n)) { 
8 clrBigInt(&a) ; 
9 return 0; 

10 ) 

H j 

12 clrBigInt(&a); 
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13 return 1; 
14] 


程序 6-17 实现 算法 6-16 MILLER-RABIN WE C 函数 的 BigInt 版 本 


函数 MillerRabin 实现 算法 6-16 的 MILLER-RABIN 过 程 ,以 1 一 1/2s 的 概率 判断 大 整 
Bon 是否 为 素数 。 若 n 是 素数 ,函数 返回 1, 和 否则 返回 0。 

函数 中 定义 的 变量 aj 与 算法 过 程 中 的 同名 变量 意义 一 致 。 

第 4 一 11 行 的 for 语句 对 应 算法 过 程 中 第 1 一 4 行 的 for 循环 。 其 中 ,第 5 行 和 第 6 行 
调用 程序 6-15 定义 的 函数 random(n) 实 现 a — RANDOM(1, "一 1) 操 作 。 第 7 一 10 行 调 
用 程序 6-16 定义 的 函数 Witness(ayn) 检 测 a 是 否 为 n 是 合 数 的 证 词 ,若是 , 则 返回 0。 循 环 
重复 s 次 完成 , 则 判断 n 为 素数 ,返回 1 。 

程序 6-14 一 程序 6-17 罗列 的 函数 均 定 义 于 numbertheory 文件 夹 的 源 文件 primetest. c 
中 ,函数 MillerRabin 的 原型 声明 于 同一 文件 夹 的 头 文件 primetest. h 中 。 在 这 两 个 文件 中 
还 包含 了 实现 MILLER-RABIN 过 程 的 C 函数 的 整 型 数据 版 本 ,读者 可 打开 文件 研读 。 


6.6 整数 分 解 


假定 有 一 个 要 做 素 因 数 分 解 的 整数 n, 即 要 将 分解 成 素数 之 积 。6. 5. 4 节 的 素数 检测 
将 告诉 人 们 n 是 合 数 ,但 它 不 能 告诉 人 们 n 的 素数 因子 。 分 解 大 整数 要 比 确定 n 是否 为 
素数 困难 得 多 。 氨 今 为 止 , 用 当今 的 超级 计算 机 和 最 好 的 算法 对 任意 1024 位 二 进 制 位 的 整 
数 进行 因数 分 解 都 是 不 可 行 的 。 最 直接 的 计算 整数 因数 分 解 的 算法 是 试 商 法 。 设 是 一 个 
合 数 。 

TRY-DIVISION(n) 

1 for d--2 ton 

2 doifdln 

3 then return d 


算法 607 用 试 商法 计算 整数 因子 的 过 程 


过 程 TRY-DIVISION 可 以 保证 在 Vn 次 试 商 后 得 到 的 一 个 因数 。 设 的 位 数 为 8, 则 运 
行 时 间 为 8(8:Wz ) 一 8(282?28%2 ) 一 OC282 ) 。 
6.6.1 Pollard 的 p 探索 法 

本 节 讨 论 一 个 用 与 TRY-DIVISION 同样 的 工作 量 , 计 算 wn? 内 的 整数 因数 (除非 运气 不 
佳 ) 的 随机 过 程 。 

POLLARD-RHO(n) 

Lesa 

2 zx; RANDOM(O, n—1) 
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3 Seo 

4 yoru 

5 k-—2 

6 repeat 

7 S<SU{ z} 

8 d < gcd(|y—zil. n) 
9 if d 7 landd n 
10 then return d 
11 Ep*ut 

12 if i=k 

13 then y = z; 

14 k- 2k 

15 aj (xi —1) mod n 
16 until z; € S 

17 return n 


算法 6-18 计算 合 数 因数 的 随机 过 程 


此 过 程 的 运行 如 下 。 第 1~3 行 初始 化 i 为 1, 随 机 地 在 Z, 中 选取 一 值 给 zi ,并 将 集合 
S 置 为 空 。 从 第 6 行 开 始 的 repeat 循环 一 直 重 复 直 至 新 得 到 的 z; 的 值 在 集合 S 中 重复 , 搜 
Z n WAR FEIE repeat 循环 的 每 次 重复 时 ,利用 第 15 行 的 迭代 

x; < (aia — 1) mod n (6-31) 
产生 无 穷 序 列 

Xi» Les X39 Bas °° (6-32) 
中 的 下 一 个 x: 的 值 ,对 应 的 i 的 值 在 第 11 行 得 到 增加 。 为 了 清晰 ,代码 中 使 用 带 有 下 标的 
变量 zi, 但 取消 下 标 程序 也 一 样 工 作 。 这 是 因为 所 要 维护 的 仅仅 是 当前 的 zx; 值 。 做 此 修改 
该 过 程 只 需 常数 大 小 的 内 存 。 
程序 偶尔 将 当前 zx; 的 值 保存 在 变量 y 中 。 具 体 地 说 ,被 保存 的 是 下 标 为 2 AY REA EL: 

X3» Has X49» Tes X39? *** 

第 4 行 保存 za 的 值 ,第 13 行 当 i 等 于 k 时 ,保存 zx。 变量 & 在 第 5 行 中 初始 化 为 2, 每 
当 y 被 修改 时 ,第 14 行将 & 加 倍 。 所 以 ,上 按 序列 1. 2, 4, 8 取 值 , 且 总 是 给 出 下 一 个 要 保 
存 到 y PIN x, 值得 下 标 。 

第 8 一 10 行 利用 保存 在 y 中 的 值 和 当前 的 z; 值 , 试 图 寻求 ”的 一 个 因数 。 具 体 地 说 就 
是 在 第 8 行 计算 的 最 大 公约 数 d=ged(|y—a;|. n). Ti d 是 2 的 一 个 非 平凡 约 数 (第 9 行 
测试 ) , 则 第 10 行 返回 d. 

POLLARD-RHO 可 能 输出 n 本 身 , 不 能 保证 它 必 得 到 的 非 平凡 因数 。 需 要 注意 的 是 
POLLARD-RHO 绝 不 会 输出 错误 的 答案 , 它 所 返回 的 数 d 必 是 的 一 个 非 平凡 约 数 。 我 们 
将 看 到 ,有 理由 期 望 POLLARD-RHO 在 经 过 其 中 的 while 循环 的 (Yn) 次 重复 就 打印 出 
的 一 个 素 因 数 p。 于 是 ,若是 一 个 合 数 ,由 于 的 每 一 个 素 因 数 p 都 可 以 期 望 它 小 于 W ， 
可 以 期 望 此 过 程 在 进行 了 ww “次 重复 后 能 够 发 现 完 成 的 因数 分 解 的 足够 多 的 约 数 。 

由 于 Z, 是 有 限 集合 , 且 序 列 (6-32) 中 的 每 一 个 值 仅 依赖 于 其 前 一 个 值 , 所 以 序 
列 (6-32) 终 究 会 重复 。 一 旦 得 到 一 个 zx; 使 得 有 某 个 j 二 i, 有 xz; 二 zj ,就 进入 一 个 周期 循环 。 
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这 是 因为 rua mapas xni rna. 名称 探索 法 是 缘 于 如 图 6-4 所 展示 的 序列 as. 
Tzs ts zj JÉ p 的 尾巴 ,而 周期 循环 uj. cpi. c ,就 形成 p 的 圈 。 
先 来 考虑 对 zi 而 言 发 生 重复 的 序列 长 度 的 问题 。 为 估计 这 个 长 度 ,假定 函 数 
f(r) = (2? —1) mod n 
的 行为 如 同一 个 随机 函数 ,虽然 这 不 是 真正 随机 的 。 这 样 可 以 认为 每 个 x; 是 按 均匀 分 布 独 
立地 从 Z, 中 选取 的 。 根 据 概率 论 的 “生日 悖 论 ” 的 分 析 , 在 得 到 周期 循环 前 期 望 的 步骤 
是 BC ) 。 
接 下 来 ,考虑 做 一 些 修改 。 设 p 是 n 的 非 平 凡 因数 使 得 gedC p. n/p) —1. PMN, din 
Ai BST fit n= pe ps pe MUTI p H po. 
FFI <a, > LV p 为 模 的 序列 二 xf 二 ,其 中 
r,— x; mod p.i = 1.2.* 
因为 只 用 以 为 模 的 算术 运算 (平方 和 减法 ) 来 定义 fz, ,我 们 将 看 到 ,可 以 由 z 算 得 nna iE 
序列 “以 p 为 模 ” 的 观点 是 以 为 模 的 较 小 的 版 本 。 
zt 一 za mod p 
= f(xi) mod p 
= (Gi — 1) mod n) mod p 
= (zi — D mod p 
= (Gr; mod p)? — 1) mod p 
= (Cx)! — Dmod p 
E falai) 
于 是 ,尽管 没有 显 式 地 计算 序列 二 zf 二 ,该 序列 是 根据 与 序列 所 zi 二 一 样 的 迭代 良好 定 
义 的 。 
图 6-5 C00 WM x, — 2 开始 的 , 按 和 迭代 r14 (a? — 1) mod 1387 产生 的 各 个 值 。1387 的 
素 因 数 分 解 是 19 。 73。 粗 箭头 表示 因数 19 发 现 前 的 选 代 次 数 。 细 箭头 指出 在 迭代 中 未 
达到 的 各 个 值 ,并 表示 成 o 的 形状 。 带 有 阴影 的 是 被 POLLARD-RHO 存储 到 y 的 值 。 因 数 
19 在 得 到 zx; 二 177 时 ,由 gcd(63 一 177, 1387 —19 计算 而 得 。 第 一 个 重复 的 x 值 是 1186， 
在 此 值 重复 之 前 ,因数 19 已 经 发 现 。 图 6-5(b) 是 以 19 为 模 的 同样 的 迭代 产生 的 值 。 在 
图 6-5(a) 中 给 出 的 每 一 个 值 xi ,是 与 此 处 的 以 19 为 模 zx! 等 价 的。 例如 ,zs 二 63 和 xz 一 177 
都 等 价 于 以 19 为 模 的 6 的 ( 意 为 63 三 6 MOD 19.177=6 MOD 19)。 图 6-5(c) 是 以 73 为 
模 的 同样 的 迭代 产生 的 值 。 在 图 6-5(a) 中 给 出 的 每 一 个 值 ri ,是 与 此 处 的 以 19 为 模 地 等 
价 的 。 根 据 中 国 剩余 定理 ,图 6-5(a) 中 的 每 一 个 结 点 对 应 一 对 分 别 来 自 于 图 6-5(b) 和 
图 6-5(c) 的 结 点 。 
与 前 面 一 样 的 理由 ,我 们 发 现 序 列 二 zf > HS AR On). Æ p 相对 于 nn BE 
小 ,序列 二 af > RAE BS OY RE <a SRS. 事实 上 ,只 要 序列 二 x; 记 中 的 两 个 元 素 关 
FR p 相等 ,而 不 是 关于 模 n FI r 之 就 发 生 重复 。 作 为 示例 ,如 图 6-5(b) 和 
图 6-5(c) 所 示 。 
设 :表示 序列 二 zi 二 中 第 一 个 重复 值 的 下 标 , 并 设 uc 0 表示 所 产生 的 周期 循环 的 长 
度 , 即 1 和 w 记 0 是 使 得 对 所 有 的 120. zt 一 zi 的 最 小 的 值 。 根 据 以 上 讨论 ,上 和 的 期 
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996—310. 
814 396 
x 
x; 077 A 
x, 1186 r xp 18 11 
xs 1194 339 529 xt 26 “47 
/ 595-1053 ; 1 
x, 63 o x 63 
/ fF s 1 
x 8 x, 8 x, xy 8 
x Í ， / MT f 
X) / x, x i 
"n 2 mod 1387 X; 2 7 mod 19 um mod 73 
(a) (b) (c) 


图 6-5 Pollard 的 p 试探 


望 值 是 GG po. ERE tiri = turi M p | Cees Ab gedGruu nes 1771. 

所 以 ,一 旦 POLLARD-RHO 在 y PERE TAEI k >t 的 zx 值 , 则 y mod p 总 是 在 以 p 为 
模 的 循环 周期 中 (车 新 的 值 存 和 人 y, 则 该 值 也 在 以 p 为 模 的 循环 周期 中 )。 最 终 ,k EX Tu. 
此 时 过 程 完 成 一 次 以 p 为 模 的 周期 循环 而 没有 改变 y 的 值 。 当 “巧遇 ”事前 存放 的 y 时 , 即 
Xi 三 y (mod p) ,就 发 现 了 的 一 个 因数 。 

按 推测 ,找到 的 因数 是 素 因 数 p, 尽 管 可 能 找到 的 是 p 的 倍数 。 这 是 因为 1 和 w 的 期 望 
iE Op) E p 的 期 望 步 又 数 是 Op). 

当然 ,此 分 析 是 启发 式 的 ,不 严格 。 这 是 因为 迭代 并 不 是 真 的 “随机 ”。 无 论 如 何 , 该 过 
程 在 实际 中 运行 良好 ,如 同 在 此 分 析 的 那样 有 效 。 这 是 一 个 对 大 整数 求 素 因 数 分 解 可 选 的 
方法 。 为 完全 分 解 8 二 进 制 位 的 整数 ,只 需要 找 出 所 有 小 于 Lm 的 素 因数 ,我 们 期 望 
POLLARD-RHO 至 多 需要 mw“ 二 2 次 算术 运算 和 mp? 二 24B* 次 位 运算 。POLLARD-RHO 
以 @(Vp ) 次 期 望 的 算术 运算 求 得 的 小 素数 因数 p 的 能 力 是 它 最 吸引 人 的 特性 。 

利用 素数 判别 过 程 MILLER-RABIN 以 及 过 程 POLLARD-RHO, 可 以 设计 出 如 下 计算 整 
数 的 素 因 数 分 解 的 算法 。 

FACTOR(n, S) D 对 nn 用 6 搜索 法 分 解 素 因 数 并 存储 于 S 

1 if MILLER-RABIN(n, 50) 

2 then S—-SU( n } 

3 return 

4 repeat 

5 d~<POLLARD-RHO() 

6 until l<d<n 

7 Factor(d, S) 

8 FACTOR(n/d, S) 


算法 6-19 整数 素 因 子 分 解 过 程 
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BUE n Æ B 二进制 位 的 整数 ,由 6.5 节 知 第 1 行 调用 MILLER-RABIN(n, s) 的 时 间 为 
OC?) ,第 4 一 6 行 的 repeat 循环 期 望 重 复 OG/n ) 王 O(282 ) 次 ,每 次 调用 POLLARD-RHOGO 
期 望 耗 时 OC», 。 所 以 ,该 循环 期 望 耗 时 OC), TAE. BOE d 和 n/d 的 位 数 为 8(8/2)， 
得 到 算法 FACTOR(n) 运 行 时 间 的 递归 方程 为 

T(B) = O(2*^ ) + 2T(8/2) 
由 此 可 见 , 用 POLLARD-RHO 分 解 整数 素 因数 的 时 间 复 杂 性 是 指数 级 的 。 


6.6.2 程序 实现 


1. hash 表 的 改造 


在 算法 6-18 的 POLLARD-RHO 过 程 中 ,要 将 伪 随 机 序列 xo, zi，…， 存储 于 集合 S 中 ， 
并 在 查找 的 非 平 凡 因子 的 迭代 过 程 中 随时 在 S 中 检测 当前 项 xz; 是 否 重复 。 对 这 样 的 要 
求 ,将 S 实现 为 hash 表 是 合适 的 。 因 为 在 hash 表 中 查找 时 间 平 均 为 常数 。 然 而 ,直接 采用 
第 2 章 中 实现 的 hash 表 并 不 能 满足 要 求 , 因 为 存储 在 hash. 表 中 的 数据 是 定 长 的 整 型 数据 ， 
而 现在 要 存储 的 是 长 整数 BigInt 类 型 。 所 以 ,需要 对 hash 表 做 必要 的 改造 : 将 对 定 长 整 
型 数据 的 操作 改 为 对 BigInt 型 数据 相应 的 操作 。 把 经 过 如 此 改造 的 hash 表 定 义 及 其 操 
作 函 数 的 定义 及 声明 分 别 存储 于 datastructure 文件 夹 的 源 文件 hash1. c 和 头 文件 hashl. 
h 中 。 下 面 仅 列 出 数据 类 型 的 定义 及 向 hash 表 插入 操作 的 函数 定义 ,读者 可 打开 文件 仔 
细 研 读 。 


1 typedef struct { / * hash 表 结构 * / 
2 LinkedList * * tables /* 槽 位 数组 * / 

3 BigInt m; /* 槽 位 数 */ 

4 size t n; /* 元 素 个 数 */ 


5 ) HashTable; 
6 int hashInsert(HashTable * t, BigInt key) ( 


7 if (linHashTable(t,key)) ( / * ERPE key * / 

8 BigInt Index— remainder(key, t-»m); — / * i $& key 的 hash 函数 值 * / 
9 long index— * (long * ) (Index. value-»nil-»next-»key)) ; 

10 clrBigInt( & Index) ; 

11 listPushFront(t->table[index], &-key); /* 在 指定 槽 位 链表 中 插入 * / 
12 t->n 十 十 

13 return 1; 

u } 

15 return 0; /* 表 中 已 有 key*/ 

16 } 


程序 6-18 存储 BigInt 型 数据 的 hash 表 定 义 及 插入 函数 


对 程序 6-18 的 说 明 如 下 。 
(1) 第 1~5 行 定义 了 存储 BigInt 类 型 数据 的 hash 表 类 型 HashTable。 与 2.5.3 WAY 
程序 2-30 的 定义 几乎 相同 ,区 别 之 一 在 于 槽 位 数 m 的 类 型 变 成 BigInt。 由 于 存储 于 表 中 的 
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大 整数 x 的 hash 值 是 该 数 与 m 整除 的 余数 x mod m 决定 的 ,为 便于 调用 定义 于 源 文 件 
bigint. c 中 的 函数 remainder( 该 函数 计算 两 个 BigInt 型 数据 a b 相 除 的 余数 a mod b) 进 行 
计算 ,所 以 把 m 的 类 型 加 以 如 此 修改 ,尽管 m 实际 大 小 完全 可 以 用 定 长 整 型 数据 表示 。 其 
次 ,各 覃 位 的 链表 里 应 存储 BigInt 型 数据 。 

(2) 第 6 一 16 行 定 义 的 函数 hashInsert 完成 向 参数 t+ 指引 的 hash 表 中 插入 参数 key 指 
定 的 BigInt 对 象 。 若 key 能 正确 插入 表 t 中 ,函数 返回 1, 否则 (key 在 t 中 已 存在 ) 函 数 返 
回 0。 

(3) 函数 体 中 ,第 7 一 14 行 处 理 将 key 插入 +t 的 操作 。 第 8 行 调用 函数 remainder 计算 
key mod my, 结果 存储 于 BigInt 型 变量 Index。 第 9 行将 Index 转换 成 long 型 数据 index 作 
为 key 的 hash 值 。 第 11 行 和 第 12 行将 key ffi AI t 的 第 index 个 槽 位 中 。 


2. p 探索 法 
利用 经 过 改造 的 hash 表 , 可 将 算法 6-18 实现 如 下 。 


1 BigInt PollardRho(BigInt n) { 
size t i=1,k=2; 
HashTable * S=createTable(100) ; 
BigInt x= random(n) ,y={NULL,0} ¿d= (NULL.0) ,t={NULL,0} ,tow=newIntByint(2) ; 


2 

3 

4 

5  intAssign Sy, 3) ; 

6 dol 

7 hashInsert(S, x) ; / * S<SU {x} */ 

8 clrBigInt( 8-0) ;t=compareInt(&-y,&-x)>0? diff(y.x):diff(x,y)s; /*t—|y—x| */ 

9 clrBigIntC 8d) ; 

10 d—euclid(t,n) ; /*d-gcd(ly—xl. m */ 
11 if( lisOne(d) &-&-comparelnt(d,n)) /*d 非 n 的 平凡 因子 */ 
12 break; 

13 EFi 

14 ifi==k){ 

15 intAssign( &y.x) ; /*yex*/ 

16 ke—1l: /*k<2k * / 

17 } 

18 clrBigInt(t) ;t= product( x, x) ;decrease( &t.1); 

19 x= remainder(t,n) ; /* xx’ —1 mod n* / 


20 — }while(!inHashTable(S, x)) ; 
21 clrBigInt(t) ;clrBigInt( tow) ; 
22 clrTable(S) ifree(S) ; 


23 return n; 


程序 6-19 ”实现 算法 6-18 POLLARD-RHO 过 程 计 算 整 数 n 的 非 平凡 因数 的 函数 


对 程序 6-19 的 说 明 如 下 。 
(1) 5j POLLARD-RHO 过 程 相同 ,函数 PollardRho 只 有 一 个 表示 大 整数 的 参数 n, 函数 
返回 n 的 非 平 凡 因数 ,也 是 大 整数 类 型 的 数据 。 
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(2) 与 算法 过 程 一 样 ,用 S 表示 存储 伪 随 机 序列 的 集合 ,第 3 行 调用 函数 createTable (100) 
将 其 初始 化 为 具有 100 个 槽 位 的 hash Ko 由 于 是 迭代 计算 序列 xi 和 yi, 所 以 只 需要 用 
变量 x 和 yy 存储 当前 项 。 变 量 d 与 算法 过 程 中 的 同名 变量 意义 一 致 ,表示 n 的 非 平凡 
因子 。BigInt 型 的 临时 变量 + 用 来 存储 计算 过 程 中 的 中 间 数 据 。tow 表示 BigInt 型 的 
数据 值 2 。 

(3) 第 4 行 调用 程序 6-15 定义 的 函数 random Cn) H x 初始 化 为 一 个 不 超过 n 的 随机 
数 , 第 5 行将 y 初始化 为 x。 第 6 一 20 行 的 do-while 循环 实现 算法 过 程 中 第 6 一 16 行 的 
repeat-until 循环 结构 。 其 中 ,第 7 行 完成 Ser 操作 ,第 8 一 10 行 完成 d<ged(| y— xl. n) 
操作 。 第 11 行 和 第 12 行 处 理 找到 n 的 非 平凡 因子 的 情形 (dln, dL 1. dAn), 58 14 一 
17 行 完成 算法 过 程 中 第 12 一 14 行 对 y 的 迭代 操作 。 注 意 , 第 13 行 用 位 移 操 作 ke = 104 
fT k=k<D RA k—2*k. 58518 行 和 第 19 行 完成 对 x 的 迭代 操作 x 一 x? 一 1 mod n. 


3. 整数 的 素 因 数 分 解 
下 列 函 数 实现 算法 6-19 。 


1 void Factor(BigInt n. RBTree * s){ 


2 BigInt d— (NULL,0) ,t— (NULL,0) , x — {NULL,0); 

3 if(MillerRabin(n,50))( /*n 为 素数 * / 

4 intAssign(&x,n) ; 

5 rbInsert(s, & x); /xn 加 入 解 集 * / 
6 return; 

7 3 

8 dol /*p 搜索 法 搜索 n 的 非 平凡 因子 dx / 
9 clrBigIntC 8d) ; 

10 d=PollardRho(n) ; 

11 }while(!compareInt(&d, &-n) || isOne(d)) ; 

12 clrBigInt(&-t) ;t=quotient(n,d) ; / * t«n/d* / 


13 Factor(d)s 
14 Factor(t); 
15 clrBigInt(&d) ;clrBigIntC 8-0 ; 


程序 6-20 ”实现 算法 6-19 FACTOR 过 程 的 C 函数 


对 程序 6-20 的 说 明 如 下 。 

(1) 函数 Factor 与 算法 过 程 一 样 有 两 个 参数 : 整数 n 和 用 来 存放 n 的 素 因 数 的 集合 s。 
之 所 以 将 s 作为 参数 而 不 作为 函数 的 返回 值 ,是 因为 Factor 是 一 个 递归 函数 ,将 s 定义 成 函 
数 的 局 部 量 不 合适 。 于 是 ,Factor 无 返回 值 。 

(2) 函数 中 变量 d 与 算法 过 程 中 的 同名 变量 意义 一 致 ,表示 n 的 非 平凡 因子 。t 用 来 表 
R n 的 另 一 个 因子 n/d。 由 于 函数 向 上 一 层 返 回 前 要 释放 变量 d 和 + 的 存储 空间 ,而 它们 是 
传递 给 下 层 递归 的 参数 n 的 ,其 值 可 能 在 下 层 递归 中 被 加 入 到 集合 s 中 ,所 以 在 加 入 前 需要 
将 其 值 复制 给 临时 变量 x。 

(3) 第 3 一 7 行 的 证 语句 实现 算法 中 第 1 一 3 行 的 计 结 构 , 调 用 程序 6-17 中 定义 的 函数 
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MillerRabin(n,50) 处 理 n 为 素数 的 情形 。 第 8 一 11 行 的 do-while 语句 实现 算法 过 程 中 
第 4 一 6 行 的 repeat-until 结构 ,调用 程序 6-19 定义 的 函数 PollardRhoCn) ,计算 n 的 非 平凡 
因子 d。 第 12 行 计算 n/d, 第 13 行 和 第 14 £314 d 和 n/d 递归 处 理 。 

为 便于 代码 重用 ,程序 6-20 定义 的 函数 存储 于 numbertheory 文件 夹 中 的 源 文件 
factor. c 中 ,其 原型 声明 于 同一 文件 夹 中 的 头 文件 factor. h 中 。 文 件 中 还 存储 了 这 两 个 函 
数 的 整 型 数据 版 本 的 定义 及 声明 ,读者 可 打开 文件 研读 。 


6.6.3 应 用 


Smith Numbers 


While skimming his phone directory in 1982. Albert Wilansky，a mathematician of 
Lehigh University. noticed that the telephone number of his brother-in-law H. Smith had 
the following peculiar property: The sum of the digits of that number was equal to the sum 
of the digits of the prime factors of that number. Got it? Smith's telephone number was 
493-7775. This number can be written as the product of its prime factors in the 
following way: 

4937775—3 * 5 * 5 * 65837 
The sum of all digits of the telephone number is 4+9+3+7+7+7+5= 42 , and the sum 
of the digits of its prime factors is equally 3 十 5 十 5 十 6 十 5 十 8 十 3 十 7 三 42. 

Wilansky was so amazed by his discovery that he named this kind of numbers after his 
brother-in-law: Smith numbers. 

As this observation is also true for every prime number, Wilansky decided later that a 
(simple and unsophisticated) prime number is not worth being a Smith number, so he 
excluded them from the definition. 

Wilansky published an article about Smith numbers in the Two Year College 
Mathematics Journal and was able to present a whole collection of different Smith 
numbers: For example. 9985 is a Smith number and so is 6036. However. Wilansky was 
not able to find a Smith number that was larger than the telephone number of his brother- 
in-law. It is your task to find Smith numbers that are larger than 4937775. 

Input 

The input consists of a sequence of positive integers. one integer per line. Each 
integer will have at most 8 digits. The input is terminated by a line containing the number 
0. 

Output 

For every number n>0 in the input. you are to compute the smallest Smith number 
which is larger than n. and print it on a line by itself. You can assume that such a number 


exists. 
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Sample Input 


4937774 
0 


Sample Output 


4937775 
1. 问题 分 析 


一 个 合 数 nn 的 各 位 数字 之 和 等 于 该 合 数 的 素 因子 分 解 中 各 因子 的 数字 之 和 , 称 其 为 
Smith 数 。 你 的 任务 是 编写 程序 ,对 给 定 的 整数 a, 计 算 大 于 a 的 最 小 Smith 数 。 解 决 该 问 
题 是 很 直接 的 : 变量 b 从 a 起 逐一 检测 ,车 b 是 合 数 计算 b 的 各 位 数字 和 sl1 ,然后 分 解 b 的 
素 因 子 , 计 算 所 有 因子 的 个 位 数字 之 和 s2, 若 s1 二 s2, 则 输出 b, 否 则 对 b 十 1 做 相同 的 检测 。 


2. 程序 实现 
将 上 述 的 解 题 思想 实现 为 如 下 程序 。 


1 int s2; /* 保存 各 素 因 子 的 数字 之 和 的 全 局 变量 * / 
2 int sumdigit(long n)( /* 计算 整数 n 的 各 位 数字 之 和 * / 
3 ints=0,m=n; 
dol 
st=m%10; 
m/=10; 
)while(m) ; 
return s; 
) 
10 void sumdigitsCunsigned long * a) { 
1l  s2---—sumdigit( * a); 


oonan eA 


12} 

13 int mainO { 

l4 inta; 

15 FILE * fl=fopen("chap06/SmithNumbers/inputdata. txt" ,"r") , 
16 * {2=fopen("chap06/SmithNumbers/outputdata. txt" ," w") ; 


17 assert Cf18. & 2); 
18  fscanfCf1." 26d". &a); 


19 while(a){ / * 对 输入 文件 中 的 每 一 个 案例 数据 ax / 

20 unsigned long s1.b—a; 

21 whileC1) { /*b 从 a 起 逐一 检测 / 

22 RBTree * factors=creatRBTree(sizeof(unsigned long) , unsignedGreater) ; 
23 if(isPrime(b) ) { /= 排除 b WRB * / 

24 btt; 

25 continue; 

26 } 

27 sl—sumdigit(b) + /* 计 算 b 的 各 位 数字 之 和 =*/ 
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28 s2—0; 

29 factor(b, factors) ; /对 b 做 素 因子 分 解 ,结果 放 在 factors 中 * / 
30 inorderRBWalk(factors, sumdigits) ;clrRBTree(factors, NULL) ; 
31 if(s1— —s2)( /= 满足 Smith 数 条 件 * / 

32 fprintf(f2,"%d\n",b); 

33 break; 

34 } 

35 b++; 

36 ) 

37 fscanfCf1, " 6d" , 8&2); 

38 } 

39 felose(f1) ;fclose(f2); 

40 return 0; 

41} 


程序 6-21 解决 Smith Numbers 问题 的 C 程序 


对 程序 6-21 的 说 明 如 下 。 

(1) 第 1 行 定义 的 整 型 全 局 变量 s2 用 来 存储 整数 b 的 所 有 素 因 子 各 位 数字 之 和 。 

(2) 第 2 一 9 行 定义 的 函数 sumdigit 计算 整 型 参数 n 的 各 位 数字 之 和 ,并 作为 函数 值 返 
回 。 第 10 一 12 行 定 义 的 函数 sumdigits 将 由 指针 参数 n 指引 的 整数 的 各 位 数字 之 和 累加 到 
全 局 变量 s2 中 。 

(3) main 函数 中 的 第 19 一 38 行 的 while 循环 处 理 输入 文件 {1 中 的 每 一 个 案例 数据 ao 
Kp AHR ToS 21 一 36 行 的 while 循环 对 b 从 a 开始 逐一 检测 ,直至 得 到 不 小 于 a 的 最 小 
Smith 数 。 对 每 一 个 合 数 b, 第 27 行 调用 函数 sumdigit 计算 其 各 位 数字 之 和 ,保存 在 sl 中 。 
第 29 行 调用 函数 factor TEST. b 的 素 因 子 分 解 , 各 因子 存储 于 RBTree 类 型 指针 factors Jf 
引 的 树 结构 中 。 该 函数 是 程序 6-16 的 整 型 版 本 。 第 30 行 调用 程序 2-17 中 定义 的 函数 
inorderRBWalk, 对 二 又 树 结构 factors 作 中 序 遍 历 ,利用 函数 sumdigits 将 存储 在 factors 中 
的 b 的 各 因子 数字 和 累加 到 s2 中 。 注 意 ,对 每 一 个 合 数 b, 第 28 行将 s2 初始 化 为 0。 若 sl 
与 s2 相等 ,第 32 行将 b 写 入 输入 文件 f2, 否 则 检测 下 一 个 b. 
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人 类 的 活动 离 不 开 资 源 竞 争 , 在 占有 有 限 资源 的 前 提 下 ,最 优化 活动 的 目标 是 人 们 的 普 
遍 追 求 。 这 就 引出 了 一 类 问题 : 如 何 才能 在 有 限 资源 的 约束 条 件 下 最 优化 活动 目标 ? 由 于 
在 约 东 条件 下 ,可 以 有 多 种 达到 目标 的 方法 或 途径 ,这 类 问题 往往 呈现 出 具有 多 个 可 能 解 ， 
每 一 个 解 都 对 应 一 个 目标 值 , 目 的 是 找 出 目标 值 最 优 的 解 这 样 的 特征 。 人 们 将 具有 这 一 特 
征 的 问题 称 为 组 合 优化 问题 。 例 如 ,下 面 这 些 问题 就 涉及 最 优化 组 合 。 

COD 航空 公司 希望 调度 其 航班 人 员 。 航 空 管理 局 有 很 多 强制 性 的 约束 ,如 航班 成 员 连 
续 工 作 的 时 数 , 一 个 航班 成 员 在 一 个 月 内 只 能 工作 于 一 种 型 号 的 飞机 上 。 航 空 公司 希望 用 
尽 可 能 少 的 航班 成 员 来 调度 所 有 的 航班 。 

(2) 石油 公司 希望 确定 在 哪里 打 井 。 钴 井 的 设置 与 成 本 、 地 质 勘 测 和 每 桶 油 的 平均 工 
资 支付 相关 。 公 司 对 钻井 的 选 址 预算 是 有 限 的 ,对 给 定 的 预算 希望 得 到 最 大 量 的 石油 。 

用 人 力 来 解 组 合 优化 问题 往往 因为 计算 量 太 大 而 可 望 不 可 及 。 自 从 有 了 计算 机 ,快速 
地 解决 所 有 的 组 合 优化 问题 似乎 看 到 电光。 于 是 大 量 的 计算 机 科学 家 投入 到 了 设计 出 解决 
组 合 优化 问题 的 有 效 算 法 的 攻关 中 了 。 事 情 远 不 是 人 们 开始 时 所 期 盼 的 那样 乐观 ,甚至 到 
了 今天 ,人 们 仍然 离 彻底 解决 这 个 问题 非常 遥远 。 但 是 , 透 过 重重 迷雾 ,人 们 已 经 有 理由 乐 
观 起 来 : 虽然 只 对 一 部 分 组 合 优化 问题 找到 了 有 效 算法 (运行 时 间 上 界 是 输入 规模 的 多 
项 式 ) ,对 组 合 优 化 问题 作 深 入 的 分 类 研究 发 现 其 中 一 大 部 分 问题 一 一 称 为 NP 完全 问 
题 一 一 具有 共同 的 性 质 ,只 要 能 找到 其 中 一 个 问题 的 有 效 算法 , 则 所 有 NP 完全 问题 都 有 有 
效 算法 。 一 旦 说 明 其 中 之 一 不 存在 有 效 算法 , 则 所 有 的 NP 完全 问题 都 不 存在 有 效 算法 了 。 
从 本 章 起 ,将 用 3 章 的 篇 幅 讨 论 解 决 组 合 优化 问题 的 各 种 算法 。 


7.1 组 合 问题 


在 解决 组 合 优化 问题 之 前 , 先 来 看 稍微 简单 一 点 的 组 合 问题 ,通过 几 个 例子 来 引入 这 一 


7.1.1 组 合 问题 的 例子 


1. m- 着 色 问 题 


考虑 3- 着 色 问 题 : 给 定 一 个 无 向 图 G— —V. E> HP Re V—(. 2. n) 
集 ECVXV。 需要 对 其 中 的 每 一 个 顶点 着 1.2、3 三 种 颜色 之 一 ,使 得 任意 两 个 相 邻 顶点 颜 
色 不 同 。 人 们 把 这 样 的 一 种 着 色 方 案 称 为 是 合法 的 ;反之 , 若 两 个 相 邻 顶点 具有 同 种 颜色 ， 
则 是 不 合法 的 。 一 个 着 色 方案 可 表示 为 一 个 维 向 量 二 zi ，za，…，,z 二 ,其 中 心 E11,，2， 
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} ,表示 第 i 个 顶点 的 着 色 , 1— imn. 例如 ,二 1, 2. 2 过 表示 一 个 具有 3 个 顶点 的 图 的 着 
a 对 一 个 具有 个 顶点 的 图 G mA A 3" 种 可 能 的 着 色 方 案 ( 包 括 合法 的 与 不 合法 
的 ) 。 一 个 问题 的 所 有 可 能 解构 成 的 集合 称 为 该 问题 的 解 空间 ,常用 符号 Q 表示 。 例 如 ,对 
一 个 具有 3 个 顶点 的 图 ,3- 着 色 问 题 的 解 空 间 Q 如 图 7-1 所 示 。 


101010 101010 101010 202020 202020 202020 30303 3030 30303 

PED BE EE II SEE EE ba Py 

102030 102030 102030 102030 102030 102030 102030 102030 10203 
图 7-1 一 个 具有 3 个 顶点 的 图 的 所 有 可 能 解 


一 共有 33—27 个 方案 。mwr 色 问题 可 形式 化 地 描述 如 下 。 

MA: AG=<V, E>。 其 中 ,V={1, 2, =, n} ,ECVXV。 颜 色 数 为 m. 

输出 : FG 存在 的 各 顶点 的 合法 着 色 方 案 , 输 出 所 有 人 解 向 量 x== 二 zi, ys ers x, > E 
"d mm AG 的 第 i 个 顶点 的 着 色 , 且 对 VY G, j)EG[E](z; 关 z), 

用 穷尽 搜索 法 在 解 空间 中 求 得 问题 的 解 的 算法 称 为 强力 算法 。 对 每 个 方案 需要 检测 每 
个 顶点 的 着 色 , 对 具有 个 顶点 的 图 来 说 ,在 具有 wm" 个 可 能 解 的 解 空间 Q 中 搜索 可 行 解 的 
运行 时 间 为 Q Gn"), 


2. 子 集 和 问题 


子 集 和 问题 是 在 一 个 整数 集合 A m (ais ass os a,} 中 ,寻求 一 个 子 集合 ACA, (EG 
A' 中 元 素 之 和 等 于 给 定 的 整数 C。 例 如 ,整数 集合 A={1, 2, 3, 4) ,整数 值 C=4, 则 A 的 
T4EU , {1,3} 都 是 合法 解 。 

(loa 被 选中 

HHR m — sss x 之 表示 子 集 和 问题 的 解 。 其 中 =| Meo 
1. 2,…,n。 于 是 ,对 上 述 整 数 集合 A-— (0.2.3. 4) ,整数 值 C=4 的 子 集 和 问题 的 两 个 合 
法 解 的 向 量 表 示 为 二 0, 0, 0, 1 二 和 二 1. 0. 1 二 。 子 集 和 问题 的 形式 化 描述 如 下 。 

LESE 整数 集合 A 二 {al， azs +s a,) ,整数 值 Co 

输出 : 向 量 z= 过 zi ,xs，…, a > HP rE (0, 1), 若 a;EA, n=l A zx;=0,i= 


1, 2, s kC EN D a “a =C. 


子 集 和 问题 的 可 能 解 是 En» Lrs s Xs, 其 中 zz E10, 1},i=1, 2, s n 
因此 , 子 集 和 问题 的 解 空间 Q 含有 2" 个 向 量 。 对 所 有 的 可 能 解 逐 一 检测 ,在 解 空间 中 搜寻 
所 有 合法 解 的 强力 算法 的 运行 时 间 下 界 为 Q(2") 。 

3. -皇后 问题 

经 典 的 8- 皇 后 问题 可 阐述 如 下 。 如 何在 一 个 8X8 的 棋盘 上 放置 8 个 皇后 使 得 任意 两 
个 皇后 之 间 不 能 相互 攻击 ? 车 两 个 皇后 同 处 于 一 行 ,一 列 或 一 斜 线 上 , 则 它们 可 相互 攻击 。 
让 皇后 问题 的 定义 是 类 似 的 . 即 对 任意 的 mn 三 1, 有 7n 个 皇后 及 一 个 nXn 的 棋盘 。 

例如 , 当 n=4 时 ,考虑 一 个 4X4 的 棋盘 。 由 于 不 能 将 两 个 皇后 置 于 同一 行 中 ,每 一 行 


O VY 是 数理 逻辑 中 的 全 称 代词 , 意 为 “对 所 有 的 ……”。 
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只 能 有 一 个 皇后 。 每 一 行 中 有 4 个 位 置 ,总 共有 从 种 可 能 的 格局 。 每 一 种 格局 可 以 用 一 个 具 


有 4 个 分 量 的 向 量 + 二 二 zz, Ts y+ 2, > INVA HA. HEP r m 

表示 棋盘 第 ; 行 的 皇后 放置 位 置 。 例 如 ,向 量 一 2, 3, 4, 1> e 

对 应 于 展示 在 图 7-2 中 的 格局 。 若 在 对 应 的 行 中 还 没有 © 

放置 皇后 , 则 该 分 量 为 零 。 事 实 上 ,由 于 不 能 将 两 个 皇后 © 

置 于 同一 列 , 任 何 一 个 放置 方案 都 应 对 应 于 1, 2, 3, 4 的 o 

ee 图 7-2 4 皇后 问题 的 一 个 格局 
将 皇后 问题 形式 化 为 如 下 。 
输入 : 棋盘 规模 。 


输出 : AIC nox n 棋盘 存在 合法 格局 , 则 输出 所 有 由 向 量 = <ar s r os ey, > AU 
的 解 ,其 中 ,zi， res vty ay Æ ls 2. n BM HERI. FL V (1<i 了 jn) 有 zi 一 2, Ai—j 
Ax, aj Aj—i Be HO He BO E958 i TE TBI iSl, 2. nns WW, 
输出 无 解 信息 。 

六 皇后 问题 的 可 能 解 为 ” HEISE rn. trs rt xm Pena ts x, 是 1,2,…， 
n 的 一 个 排列 。 所 以 ,所 有 可 能 解构 成 的 解 空间 Q 含有 ww" 个 元 素 。 对 每 个 可 能 解 检 测 其 合 
法 性 ,在 解 空 间 中 搜索 合法 解 的 强力 算法 将 耗 时 OC") o 


7.1.2 组 合 问 题 的 形式 化 描述 


考虑 上 述 3 个 问题 ,它们 有 一 些 相 同 的 特征 。 首 先 ,它们 的 解 都 可 表示 为 n 维 向 量 
过 zx1， toy ty r2. HTAR x; 取 值 于 一 个 有 限 集合 Xi 一 1, 2,…, mn。 在 3- 着 色 问 题 
中 ,X; 二 {1, 2,3),i 二 1, 2,…, n。 子 集 和 问题 中 ,X; 二 {0, 1) ,i 二 1, 2,…, no ME nE 
后 问题 中 ,X;=={1,，2,…, n} ,一 1，2，…, n。 其 次 ,有 一 个 判断 向 量 rà. xc 
rQ2 € Q— X, X XXX X, 是 否 合法 的 函数 /: 0- (true. false}, fE 3- 着 色 问 题 中 ,此 f£ 
就 是 检测 图 G 中 任意 两 个 顶点 zjJEVLG], 若 边 (i, j) CEG] a: 是 否 不 等 于 x;。 在 子 集 


和 问题 中 ,此 三 就 是 检测 5 za 是 否 等 于 给 定 的 值 C。 而 在 -皇后 问题 中 ,此 / 就 是 检 
i-1 


测 每 个 zx; 与 其 他 一 1 个 分 量 是 否 不 等 且 不 在 一 条 直线 上 。 

我 们 的 任务 是 在 所 有 的 这 样 的 向 量 构成 的 解 空 间 Q 中 搜索 合乎 条 件 /Cr xs，…， 
z,) — true 的 合法 解 。 于 是 可 以 一 般 地 将 组 合 问题 描 形式 化 地 述 为 如 下 。 

输入 : n PARER Xi Xs eo X, 构成 的 笛 卡 儿 积 OT XX XXX X, 

输出 : Q 的 子 集 S ,使 得 V <a, Tzs ets ty > ES. flay, Tzs “+ x) =true, 

对 于 组 合 问题 ,可 以 用 如 下 强力 算法 解决 。 

BRUTE-FORCE(X; + X25 *. X,) 

1 AX, XX,,X--XX, 

2 for each z— «rn, x2, +, a> EN 

3 do if f(a, z;. 7. r,)—true 


4 then print x 
算法 7-1 解决 组 合 问题 的 强力 算法 
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设 |Q|==g(n),f 的 运行 时 间 为 1(n), 则 BRUTE-FORCE 的 运行 时 间 是 TG = Cg GD + 
1600, fln. 3-2: GI Bir g G0 —3" ,由 于 对 每 个 可 能 解 需要 检测 n 个 分 量 是 否 合法 , 故 
t(n) =n, BRUTE-FORCE 解决 3- 着 色 问 题 的 运行 时 间 全 (n) 二 8(n3")。 类 似 地 , 子 集 和 问题 
"Bh g(n) = 2" ,t(n) =n, BRUTE-FORCE 解决 子 集 和 问题 的 运行 时 间 T (n) 三 9(z2")。 而 在 
和 -皇后 问题 中 ,g(z) = n" £O) =n, BRUTE-FORCE 解决 2 皇后 问题 的 运行 时 间 T Cn) = 
Gon», 


7.2 组 合 问题 的 回溯 算法 


对 很 多 组 合 问题 运用 强力 算法 BRUTE-FORCE 解决 ,会 遭遇 时 间 黑 洞 。 因 为 很 多 组 合 
问题 的 解 空间 Q 中 可 能 解 的 个 数 G0 (gm) 二 191) 是 输入 规模 的 指数 表达 式 ,例如 ,上 
述 3 个 例子 都 是 这 样 的 情况 。 于 是 人 们 把 注意 力 放 在 如 何 压缩 解 空间 ,来 提高 算法 的 运行 
效率 。 一 个 粗略 的 想法 是 按照 某 种 层次 结构 组 织 解 空间 ,虽然 这 样 做 并 没有 减 小 解 空 间 , 但 
能 够 减少 搜索 合法 解 时 所 做 的 检测 次 数 。 


7.2.1 解 空间 的 树 状 结构 


仍 以 上 述 3 个 问题 为 例 来 说 明 解 空间 的 树 状 结构 。 
1. m- 着 色 问 题 


由 7.1 节 的 讨论 ,我们 知道 具有 个 顶点 的 图 G 的 3- 着 色 问 题 的 解 空间 Q 包含 3" 个 可 
能 解 ,为 判断 9 中 的 一 个 形式 为 n 维 向 量 的 可 能 解 是 否 合法 ,需要 检测 其 所 及 个 分 量 , 因 
此 ,解决 3- 着 色 问 题 的 强力 算法 BRUTE-FORCE 要 做 n3" 次 检测 。 图 7-1 展示 了 具有 3 个 顶 
点 的 图 G 的 3- 着色 问题 的 解 空间 。 仔 细 考 察 其 中 的 27 个 着 色 方案 ,可 以 发 现 很 多 方案 具 
有 相同 的 部 分 : 前 9 个 方案 的 第 一 个 顶点 的 都 着 1 色 , 前 3 个 方案 的 前 两 个 顶点 都 着 1 
色 ，…… 。 因 此 ,考虑 把 前 面相 应 分 量 值 相 等 解 组 合 起 来 ,将 解 空间 组 织 成 一 个 树 结构 。 例 
如 ,对 具有 3 个 顶点 的 图 ,其 解 空间 可 表示 为 图 7-3 所 示 的 称 为 搜索 树 的 完全 三 又 树 。 


123123123123123123123123123 
图 7-3 一 个 具有 3 个 顶点 的 图 G 的 3- 着 色 问题 解 空间 的 树 结构 


在 搜索 树 中 , 树 根 表示 初始 状态 一 一 尚未 考虑 解 向 量 的 任何 分 量 。 树 根 下 的 第 1 层 结 
点 表示 解 向 量 x 的 第 1 个 分 量 所 有 可 能 的 取 值 。 在 3- 着 色 问 题 中 ,第 1 个 分 量 有 3 种 可 能 
的 着 色 方式 : 1 或 2 或 3。 对 应 树 根 下 第 1 层 的 3 个 结 点 。 对 于 第 一 个 分 量 每 一 种 着 色 方 
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式 ,第 2 个 分 量 也 有 3 种 着 色 方 式 。 所 以 树 根 下 第 2 层 共有 9 个 结 点 ,它们 分 别 是 第 1 层 的 
3 个 结 点 的 孩子 。 同 理 , 根 下 第 i 层 的 3 个 结 点 对 应 解 向 量 中 第 i 个 分 量 在 第 i 一 1 个 分 量 
确定 后 的 各 种 着 色 方 式 。 于 是 ,对 解 空间 中 的 3* 个 可 能 解 的 每 一 个 ,对 应 搜索 树 中 从 根 开 
始 到 达 一 片 叶子 的 路 径 上 除根 以 外 的 各 个 结 点 组 成 的 向 量 。 
于 是 ,对 解 空 间 中 所 有 可 能 解 判断 合法 性 过 程 中 检测 的 次 数 为 
3 十 3 十 … 十 3* 一 1 十 3 十 3 十 … 十 3" 一 1 
= 2 —1)/2—1 
< 
x n3" /2(n È 3) 
E n2z-3 时 ,对 组 织 成 搜索 树 的 解 空间 中 可 能 解 判断 合法 性 对 向 量 的 分 量 所 做 的 检测 次 数 
比 对 原本 的 解 空 间 做 同样 操作 时 所 作 的 检测 次 数 减少 了 一 大 半 。 


2. 子 集 和 问题 


由 7.1 节 知 ,对 具有 个 整数 a1 azs ets av ARA C 的 子 集 和 问题 的 每 个 可 能 解 x 
是 一 个 n 维 向 量 , 其 每 一 个 分 量 非 0 BU 1。 故 解 空 间 Q 包含 2 个 可 能 解 。 为 检测 可 能 解 的 
合法 性 需 检测 其 每 一 个 分 量 。 于 是 ,解决 子 集 和 问题 强力 算法 BRUTE-FORCE 要 做 n2" 次 检 
测 。 仿 照 3- 着 色 问 题 ,可 将 此 2" 个 可 能 解 组 织 成 一 棵 搜索 树 。 由 于 解 向 量 的 每 个 分 量 取 且 
仅 取 0 和 1 两 值 之 一 , 故 子 集 和 问题 的 搜索 树 是 一 棵 完全 二 又 树 。 图 7-4 GR T n=4 时 的 
WA 


图 7-4 4 个 元 素 的 子 集 和 问题 的 搜索 树 


将 子 集 和 问题 的 解 空间 Q 组 织 成 搜索 树 后 ,每 一 个 可 能 解 对 应 树 中 从 根 开始 到 达 一 片 
叶子 的 路 径 上 除了 根 结 点 以 外 的 个 结 点 构成 的 向 量 。 

此 时 对 解 空 间 中 的 可 能 解 判断 其 是 否 合法 所 做 的 检测 次 数 为 

2 十 2 十 … 十 2" 一 1 十 2 十 2 十 … 十 2" 一 1 
L-29—2 
而 对 原本 的 解 空间 做 同样 操作 时 所 做 的 检测 次 数 m2" ,两 者 相差 
n2" — (278 —2)= n2?" — 27? 4+2 
= 2" (n—2)+2 

也 就 是 说 ,后 者 比 前 者 少 做 了 2"(n 一 2) 十 2 次 检测 。 


3. 1- 皇 后 问题 


对 棋盘 规模 为 n Xn 的 皇后 问题 ,其 解 空间 Q 含有 x 个 可 能 解 ,对 每 个 表示 为 n HE 
向 量 的 可 能 解 为 判断 其 是 否 合法 ,必须 检测 其 每 一 个 分 量 。 故 解决 六 皇后 问题 强力 算法 
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BRUTE-FORCE 要 做 n" Ez UU, 55 3- 着 色 问 题 和 子 集 问题 相仿 ,可 以 把 解 空 间 组 织 成 一 
棵 结构 为 nn 叉 完全 树 的 搜索 树 , 使 得 Q 中 的 每 一 个 可 能 解 对 应 搜索 树 中 从 根 开始 到 达 一 片 
叶子 的 路 径 上 除了 根 结 点 以 外 的 n 个 结 点 构成 的 向 量 。 图 7-5 展示 了 4- 皇 后 问题 组 织 成 
搜索 树 的 解 空间 。 其 中 根 下 第 1 层 结 点 对 应 第 1 行 中 皇后 的 摆 放 位 置 ,由 于 图 形 比较 繁杂 ， 
故 仅 列 出 第 1 棵 和 第 4 棵 子 树 ,省 略 了 第 2 EROS S 棵 子 树 。 


对 组 织 成 搜索 树 的 解 空间 中 的 所 有 可 能 解 判 断 其 合法 性 时 ,对 解 向 量 中 各 分 量 的 检测 
次 数 为 


ng cvec4brt—dbnactzEÉct-ectsa-l 


LG —R 


1 
n—1 

. Ht a 
n=l 


72 —n 
n/2 
= 2n" — 2 
对 原本 的 解 空间 做 同样 操作 时 所 做 的 检测 次 数 相 比 ,两 者 之 差 为 
n" 一 E M» n — 2n" +2 
> w= 
= n"(n—2) 


也 就 是 说 , 解 空间 组 织 成 搜索 树 后 ,检测 次 数 将 至 少 减少 ww"(n 一 2) 次 。 


7.2.2 解决 组 合 问题 的 回溯 算法 


我 们 已 经 看 到 ,将 解 空间 组 织 成 搜索 树 后 ,在 解 空 间 中 搜索 合法 解 时 ,可 能 减少 大 量 的 
检测 时 间 。 但 须 对 强力 算法 BRUTE-FORCE 过 程 加 以 修改 ,使 其 能 在 搜索 树 中 搜索 所 有 的 
合法 解 。 仍 然 以 上 述 的 3 个 组 合 问 题 为 例子 。 

1. m- 着 色 问 题 


搜索 过 程 维 护 一 个 渐 增 的 部 分 解 : 已 合法 着 色 的 部 分 项 点。 利用 搜索 树 , 从 树 根 下 第 
一 层 结 点 起 , 按 深度 优先 的 策略 进行 搜索 : 对 当前 结 点 着 色 ,判断 其 是 否 合法 。 若 是 , 则 进 
和 下 一 层 结 点 进行 搜索 ,否则 变换 到 当前 结 点 的 兄弟 结 点 , 即 淘汰 本 结 点 及 其 子孙 结 点 。 若 
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对 应 的 顶点 对 3 种 着 色 均 不 是 合法 的 , 则 搜索 回溯 到 当前 结 点 的 父 结 点 ,并 变换 到 其 兄弟 结 
点 。 若 从 根 起 到 达 树 中 的 一 片 叶子 的 着 色 方案 是 合法 的 ,输出 合法 解 ,并 回溯 。 

例如 ,考虑 图 7-6(a) 所 示 的 图 G, 要 对 其 顶点 用 颜色 {1, 2, 3} 来 着 色 。 图 7-6(b) 部 分 展 
示 了 合法 着 色 方案 形成 过 程 中 搜索 树 的 路 径 。 首 先 , 在 产生 出 第 3 个 结 点 后 ,发 现 着 色 方案 
去 1，1> 不 是 合法 部 分 解 ,所 以 该 结 点 在 图 中 用 *X ?标识 为 死结 点 。 接 着 2 涂 成 颜色 2, 这 
样 着 色 方案 二 1, 2 二 看 起 来 是 一 个 部 分 解 。 于 是 产生 一 个 对 应 于 顶点 5 的 新 的 孩子 结 点 ， 
其 初始 着 色 为 1。 重复 上 述 过 程 ,最 终 将 得 到 一 个 合法 的 着 色 方案 二 1, 2, 2, 1, 3>. HF 
搜索 树枝 繁 叶 茂 ,一 页 画面 不 足以 展示 整个 搜索 过 程 , 仅 画 出 a 二 1 的 子 树 部 分 。 读 者 可 自 
行 补充 其 余部 分 。 


(a) RHR 


e-le-2 e=3 el e=2 e=3 e-le-2e-3e-le-2e-3 


(b) 
图 7-6 利用 回溯 解决 3- 着 色 问 题 的 一 个 例子 


上 述 的 想法 用 伪 代 码 表示 为 过 程 M-COLOR 和 GRAPH-COLOR 。 


M-COLOR(G) 

1 solutions- 

2 为 解 向 量 z 分 配 存储 空间 

3 GRAPH-COLOR(G, 1) 上 从 根 起 对 以 下 第 1 层 结 点 进行 搜索 


4 return solutions 


算法 7-2 求解 3- 着 色 问题 的 算法 
算法 7-2 中 第 3 行 调用 下 列 递归 算法 ,以 回溯 策略 探索 能 否 对 图 G 进行 3- 着 色 。 


GRAPH-COLOR(k) 


lif kn 上 判断 是 否 为 完整 解 

2 then solutions< solutions Ul-xis x25 t» x, >} 

3 return 

4 for color<1 to m 户 对 当前 第 个 顶点 逐一 检测 3 种 可 能 的 着 色 


5 do 2,<-color 


6 if VISI<A(G, D€E[G] 5 x00 上 > 部 分 合法 


O 此 处 符号 一 是 数理 逻辑 中 的 荀 涵 连接 词 , 对 两 个 命题 a 与 b, 命 题 a~~b BH a M b”. 
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7 then GRAPH-COLOR(k+ 1) DHEA F-BBR 
算法 7-3 RRA G 的 第 & 个 顶点 的 着 色 方 案 的 递归 过 程 


对 算法 7-2 和 算法 7-3 的 说 明 如 下 。 

CD 算法 7-3 是 在 前 一 1 个 顶点 具有 合法 着 色 的 前 提 条 件 下 进行 计算 的 。 第 1 一 4 fr 
检测 是 否 &>” ,若是 意味 着 工 已 是 一 个 完整 的 合法 解 ,将 其 加 入 到 合法 解 集合 solutions 中 。 

(2) E kn FB 4 一 7 行 的 for 循环 对 第 上 个 顶点 逐一 检测 wm 种 着 色 : 若 检测 到 一 种 颜 
色 是 合法 的 , 则 对 第 & 十 1 个 顶点 递归 地 进行 探索 。 若 3 种 着 色 都 不 合法 将 回溯 到 上 一 个 项 
点 继续 检测 其 他 可 能 的 着 色 。 

(3) 应 当 注 意 的 是 ,无 须 存储 整 棵 搜索 树 ,只 需要 存储 从 根 到 当前 活动 结 点 的 路 径 。 事 
实 上 ,根本 就 不 产生 实际 的 结 点 , 整 棵 树 是 隐 含 的 。 仅 需要 跟踪 已 着 颜色 的 各 个 顶点 (也 就 
是 解 向 量 zx 的 前 A 个 分 量 ) 。 

上 述 的 递归 过 程 易于 理解 ,但 对 计算 机 而 言 ,递归 过 程 比 迭代 过 程 消 耗 更 多 的 系统 资源 
(系统 栈 ) 。 注 意 到 算法 7-3 的 递归 调用 处 于 过 程 的 末尾 ,对 于 末尾 递归 的 算法 很 容易 转换 

与 之 等 价 的 迭代 算法 。 
m-COLOR(G, m) 
1 solutions- 


2 allocate x and for 1<i<n set x; as 0 


3k<1 b JB 1 层 开始 探索 
4 while k>1 

5 do while z, <m bun€x 

6 do r:r, +1 

7 if V1<i<k((i, k) E ELG] x; x) > 部 分 合法 

8 then if k=n 上 完整 解 ,输出 

9 then so/utions*- solutions U (xi. 225 c. m7) 
10 exit this while loop 

1 else &--k--1 合法 但 不 完整 ,进一步 探索 
12 z--0 

13 k-—k—1l 上 > 回溯 


14 return solutions 


算法 7-4 解决 mr 着 色 问 题 的 回溯 算法 的 迭代 版 本 


算法 7-4 是 算法 7-2 与 算法 7-3 的 结合 。 第 1 一 2 行 完成 与 算法 7-2 的 第 1 行 和 第 2 
行 操作 一 样 的 任务 ,初始 化 合法 解 集合 solutions 并 为 解 向 量 z 分 配 存储 空间 。 稍 有 不 同 的 
是 ,在 迭代 版 本 中 , 解 向 量 的 各 分 量 是 通过 自身 增值 来 改变 颜色 号 ( 见 算法 7-4 的 第 6 行 )， 
而 在 递归 版 本 中 是 对 其 直接 赋值 来 改变 的 ( 见 算法 7-3 的 第 5 行 )。 所 以 ,算法 7-4 中 ,在 为 
工分 配 空间 的 同时 ,还 需 将 其 所 有 分 量 v. 初始 化 为 0。 算 法 7-4 的 第 14 行 对 应 算法 7-2 的 
第 4 行 , 即 整个 解 空 间 搜索 完毕 ,返回 合法 解 集合 solutions。 算 法 7-4 的 第 3 一 13 行 等 价 于 
算法 7-2 中 第 3 行 对 算法 7-3 的 调用 GRAPH-COLOR(G, D. 。 由 于 GRAPH-COLOR 是 一 个 未 
尾 递 归 的 过 程 , 所 以 这 一 部 分 可 用 一 个 while 循环 (第 4 一 13 行 ) 来 替代 递归 。 需 要 注意 的 
是 ,此 处 第 5 一 11 行 的 while 循环 与 算法 7-3 中 第 4 一 7 行 的 for 循环 是 有 区 别 的 。 此 处 的 
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循环 条 件 是 x 二 m, 而 在 循环 体 中 可 能 发 生变 化 ( 见 第 11 行 向 下 层 进一步 探索 ), 所 以 zx 
本 次 的 值 是 根据 前 次 值 自 增 得 以 变化 。 此 外 ,该 while 循环 结束 意味 着 对 当前 的 ze 检测 完 
了 所 有 可 能 的 值 ,需要 回溯 ,回溯 前 zx 要 清 0( 第 12 行 )。 而 对 于 算法 7-3 的 第 4 一 7 行 的 
for 循环 而 言 , 循 环 中 & 不 会 变化 ,向 下 层 探 索 的 任务 是 由 递归 来 完成 的 。 于 是 无 须 记 忆 
zh， 这 一 工作 由 系统 栈 来 完成 。 

鉴于 迭代 算法 比 递归 算法 的 执行 效率 更 高 ,本 书 今 后 均 以 迁 代 方式 描述 回 测算 法 。 


2. 子 集 和 问题 


与 解决 3- 着 色 问 题 类 似 的 搜索 思路 .对 子 集 和 问题 的 搜索 树 , 从 树 根 下 第 1 层 开始 , 按 
深度 优先 策略 在 树 中 搜索 合法 解 。 例 如 ,对 整数 集合 A m L1. 2, 3, 4), 整 数值 C 一 4, 且 以 


»» za; S C 为 判断 (zi，zs，…，zt) 是 否 部 分 合法 的 规则 ,图 7-7 展示 了 在 搜索 树 中 搜索 
合法 解 的 过 程 ,图 中 的 死结 点 标 为 ~X”。 


xO xl xO xl xzF0 xe aO xl xzF0 xel xzF0 xl 


图 7-7 利用 回溯 策略 解决 整数 集合 A (1, 2, 3, 4) ,常数 C 一 4 的 子 集 和 问题 


搜索 过 程 从 根 下 第 一 层 =1 的 结 点 zi 一 0 开始 ,只 要 》) zia; <4, 就 往 下 一 层 继续 


ii 
探索 ROPE eo AREE A TR as r 047 = —0. 0. 0 二 是 合法 的 部 分 解 。 继 续 往 下 
一 层 探 索 二 zi ，zs T3, 0470 — —0. 0, 0. 0 二 虽然 部 分 合法 ,但 n= 二 4 已 经 无 法 继续 往 下 探 
JR loan. xi. r7 =<0, 0, 07 RE, —0 是 一 个 死结 点 。z 自 增 1 后 成 为 1, 此 时 过 x ， 
ds my. Q20— 0. 0. 0. 1 二 构成 一 个 合法 解 ,输出 后 回溯 。 图 中 其 他 死结 点 的 判定 及 另 
一 合法 解 二 zl ，z ，zs，z4 二 一 二 1. 0, 1, 0 二 的 获得 与 此 相似 ,不 再 歼 述 。 将 回溯 过 程 写 
成 伪 代 码 如 下 。 


SUBSET-SUM(A) 

1 solutions- 

2 allocate x and set each zi as —1 

3k-l DAS 1 层 开 始 探索 
4 while k>1 

5 do while z, —1 

6 do r,r, +1 Da,€X={0,1} 


A 
7 if >) za; «C 上 部 分 合法 
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8 then if » za;—C DESEAS M Rd 

9 then solutions *- solutions U{< xi, 225 "+5 2477) 

10 exit this while loop 

11 else if k>n 上 达到 树叶 ,但 并 非 合法 

12 then if x,>1 

13 then exit this while loop 

14 else k<-k+1 上 合法 但 不 完整 ,进一步 探索 
15 zy€—1 

16  k-—k—1l 上 > 回溯 


17 retun solutions 
算法 7-5 解决 子 集 和 问题 的 回溯 算法 


由 于 解 向 量 中 每 个 分 量 的 取 值 范围 均 为 (0, 1) , 故 第 2 行将 所 有 分 量 初始 化 为 一 1, 第 
15 行 回溯 前 将 zx 置 为 一 1, 以 呼应 第 4 一 12 行 的 zx 的 自 增 1 操作 。 


3. 7- 皇后 问题 


在 -皇后 问题 组 织 成 搜索 树 中 按 回 溯 策 略 搜索 合法 解 的 过 程 与 前 两 个 例子 是 一 样 的 。 
WF n=4 的 情形 ,算法 找到 一 个 合法 解 的 执行 过 程 如 图 7-8 所 示 。 图 中 的 死结 点 标 为 
“X”。 首 先 ,zi 置 为 1 且 zs 置 为 1。 这 将 导致 一 个 死结 点 ,因为 这 两 个 皇后 置 于 同一 列 中 。 
车 zs 置 为 2 也 将 发 生 同 样 的 结果 ,因为 这 两 个 皇后 置 于 同一 斜 线 上 。 将 zs 置 为 3 将 导致 
一 个 部 分 解 向 量 二 1, 3 之 上 且 探索 对 zs 寻求 一 个 值 。 如 在 图 7-8 中 所 示 ,无 论 zs 假设 为 何 
值 ,都 不 会 得 到 zi — 1. 22 —3 及 zs 二 0 的 部 分 解 。 所 以 搜索 回溯 到 第 二 层 并 对 zs 赋予 一 
个 新 的 值 , 即 4。 如 图 所 示 , 这 导致 了 部 分 解 向 量 二 1, 4. 2 之 。 此 向 量 还 是 不 能 被 扩展 ,在 
产生 出 一 些 新 的 结 点 后 ,搜索 回 到 第 一 层 。 现 在 ,zi 增加 为 2, 以 同样 的 方式 ,找到 部 分 解 向 
量 二 2, 4, 1 之 。 如 此 ,此 向 量 被 扩展 为 合法 向 量 二 2, 4, 1. 3 二 ,这 就 对 应 一 个 合法 解 。 搜 
索 过 程 写成 伪 代 码 如 下 。 


N-QUEENS(n) 

1 solutions- Ø 

2 ke1 DAB 1 层 开始 探索 
3 allocate x and set each z, as 0 

4 while k>1 

5 do while z, <n DuEX 

6 do xa, +1 

7 if VISi<k(2,A z,and|z —dnl|zli-kD 上 合法 部 分 解 

8 then if k=n DEI M D 
9 


then solutions < solutions U {< x1, £2, t. x79) 


10 exit this while loop 

1 else 人 < 十 1 上 > 合法 但 不 完整 ,进一步 探索 
12 z,--0 

13 k-—k-1 > las 


14 return solutions 


算法 7-6 解决 -皇后 问题 的 回溯 算法 
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图 7-8 利用 回溯 解 7- 皇 后 问题 的 一 个 例子 


7.2.3 回溯 算法 的 框架 


1. 算法 框架 


虽然 算法 7-4 一 算法 7-6 描述 的 是 解决 不 同 组 合 问题 的 回溯 算法 ,观察 可 知 , 它 们 的 基 
本 框架 是 一 致 的 。 这 是 因为 ,首先 ,它们 作为 组 合 问题 有 相同 的 输入 数据 结构 和 输出 数据 结 
构 。 其 次 ,它们 的 解 空间 被 组 织 成 搜索 树 结构 。 最 后 ,对 搜索 树 的 搜索 方式 也 都 是 按 深 度 优 
先进 行 的 。 仔 细 考 察 ,三 者 之 间 还 是 有 些微 妙 的 差别 : 首先 ,第 2 行 对 解 向 量 的 分 量 初始 化 
值 未 必 相 同 ,算法 7-4 和 算法 7-6 初始 化 为 0, 而 算法 7-5 却 初始 化 为 一 1。 当 然 算法 7-4、 算 
法 7-6 第 12 行 与 算法 7-5 的 第 15 行 回溯 前 对 zx 的 恢复 初始 值 也 不 尽 相同 。 还 有 第 5 行 的 
循环 条 件 也 不 相同 ,算法 7-4 是 bem ,算法 7-5 是 4 一 1, 而 算法 7-6 是 二 n。 这 些 差别 是 
因为 解 向 量 的 分 量 取 值 集合 的 差异 引起 的 。 其 次 ,第 7 行 判 断 部 分 解 二 x sri nm JE 
合法 的 规则 不 同 ,算法 7-4 的 是 V1<i<k((i, k) EGLE] a x0 ERE 7-5 的 是 >) 
p 
za; SC, 而 算法 7-6 IJ V 1-i—RG 7 x, and |zi 一 zr| 关 |i 一 k|)。 第 8 行 判 断 过 zx， 
za，…， 必 全 是 否 为 完整 解 的 规则 也 不 尽 相同 ,算法 7-4 和 算法 7-6 的 是 k= 二 n, 算 法 7-5 的 
是 D) ra; = C. 这 刚好 反映 了 它们 解决 的 是 不 同 的 组 合 问题 。 
img 
这 3 个 算法 的 异同 ,促使 我 们 考虑 能 不 能 设计 一 个 通用 的 解决 组 合 问题 的 回溯 算法 ? 
回答 是 肯定 的 。 针 对 前 面 指出 第 一 个 区 别 点 ,只 要 将 解 向 量 的 各 分 量 取 值 集合 作为 参数 传 
递 给 算法 ,就 可 以 统一 的 方式 逐一 取得 其 中 的 每 一 个 值 。 对 于 第 二 个 区 别 点 ,可 以 将 具体 问 
判断 部 分 合法 解 与 判断 合法 完整 解 的 规则 写成 特定 的 过 程 ,而 在 回溯 算法 中 加 以 调用 。 依 
据 此 思路 ,针对 7.1.2 节 中 所 描述 的 一 般 组 合 问题 ,给 出 下 列 一 般 的 回溯 算法 过 程 。 


BACKTRACKITER(X; ，Xa ，…，X。) b X, 是 解 向 量 z 中 分 量 zx 的 取 值 集合 
1 solutions- 
2 ke1 DIME 1 层 开始 探索 


3 while 41 
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4 do while X, is not exhausted DR kB 

5 do z, «next element in X, 

6 if IS-PARTIALGz: , 225 t. a) 户 合法 部 分 解 

7 then if IS-COMPLETECz, , x», * 524) 上 > 完整 解 , 输 出 

8 then solutions<solutionsU{< xi. 225 t 二 } 

9 if X, is not exhausted then continue this while loop 

10 ifk=n 上 > 达到 树叶 ,但 非 合法 解 
11 then if X, is exhausted 

12 then exit this while loop 

13 else kk +1 上 > 部 分 合法 但 不 完整 ,进一步 探索 
14 reset X, 

15 k-—k-1 b plas 


16 return solutions 
算法 7-7 回溯 算法 的 框架 


之 所 以 把 算法 7-7 称 为 回溯 算法 的 框架 ,是 因为 要 运行 解决 组 合 问 题 ,需要 向 它 “ 填 充 ” 
以 下 东西 。 

CD. 解 向 量 z 的 每 一 个 分 量 的 取 值 集合 X;，X,,，…，X, 作为 传递 给 BACKTRACKITER 
的 参数 。 
(2) 判断 向 量 二 an. ass rns zi 二 是 否 为 合法 部 分 解 的 IS-PARTIAL 过 程 , 供 
BACKTRACKITER 在 第 6 行 调用 。 

G) 判断 向 量 二 mxz，…， xz 之 是否 为 合法 解 的 IS- COMPLETE id f. 供 
BACKTRACKITER 在 第 7 行 调用 。 

作为 例子 ,我 们 对 3- 着 色 问 题 给 出 刻画 其 特性 的 数据 与 过 程 。 

为 用 算法 7-7 解决 3- 着 色 问 题 , 令 集合 X={1, 2, 3) IE G— V. E> n os. 
则 XXXX…XX 作 为 传递 给 BACKTRACKITER 过 程 的 参数 。 此 外 ,还 要 编写 下 列 两 个 

A 

过 程 。 

IS-PARTIAL(z1, 225 "ts xe) 

1 for i<-1 to k—1 

2 doif (i, )€E[G] and zi ^x, 

3 then return false 

4 return true 

Is-COMPLETE(z,; 5 Tzs ** 5.24) 

1 if k=n 

2 then return true 

3 return false 


算法 7-8 刻画 mr 着 色 问题 的 2 个 特性 过 程 
读者 可 仿照 算法 7-8 写 出 子 集 和 问题 与 六 皇后 问题 的 特性 过 程 IS-PARTIAL 和 IS- 
COMPLETE。 
综 上 所 述 , 用 算法 7-7 解决 组 合 问题 ,可 以 通过 以 下 步骤 进行 。 
CD 将 问题 加 以 形式 化 描述 , 即 确定 作为 输入 数据 的 个 集合 XX , Xes ee Xa ,并 将 输 
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出 数据 描述 为 n 维 向 量 z= 二 xi. oxi. cn oa, > JEP xz; EXi,i==1, 2, 7. ne 

(2) 根据 问题 特性 ,描述 判断 部 分 解 、 完 整 解 的 过 程 IS-PARTIAL 和 IS-COMPLETE。 

G) 传递 参数 Xi. X2, +, X,.3247 BACKTACKITER 过 程 ,调用 IS PARTIAL 和 Is- 
COMPLETE 解决 组 合 问题 。 


2. 程序 实现 


1) 数据 的 表示 

对 于 组 合 问题 的 输入 数据 ,根据 前 面 的 讨论 可 知 , 解 空间 Q 表示 成 解 向 量 各 分 量 取 值 
集合 XIG=1, 2, +. nn) 的 笛 卡 儿 积 。 在 程序 中 ,是 一 个 一 个 分 量 逐 一 考察 的 ,所 以 只 要 将 
每 个 分 量 的 取 值 集合 X; 表示 出 来 就 可 以 了 。 由 于 各 分 量 的 取 值 集合 所 含 元 素 个 数 编程 时 
并 不 知道 ,所 以 将 它们 表示 成 链表 。 对 于 每 个 分 量 的 取 值 集合 ,算法 中 需要 记忆 各 自 当前 的 
元 素 位 置 ,以 便于 下 一 个 元 素 的 读 取 ,所 以 还 需要 为 每 一 个 表示 成 链表 的 集合 设置 一 个 当前 
结 点 指针 。 下 列 定义 的 数据 类 型 ValueSet 就 是 用 来 表示 解 向 量 分 量 取 值 集合 X; 的 。 

1 typedef struct{ /* 解 向 量 分 量 取 值 集合 类 型 * / 

2 LinkedList * list; /* 存 储 一 个 分 量 所 有 可 能 取 值 的 链表 / 

3 ListNode * current; /* 当前 访问 的 结 点 指针 * / 

4 ) ValueSet; 

程序 7-1 表示 解 向 量 取 值 集合 的 结构 体 类 型 


而 将 Q 直接 表示 成 ValueSet BX N;,G=1. 2, 7. 2) 的 数组 。 由 于 ValueSet 含有 
链表 LinkedList 类 型 的 指针 属性 list, 所 以 需要 有 一 个 对 不 再 使 用 的 这 类 对 象 清理 存储 空 
间 的 函数 。 

1 void clrSet(ValueSet * set, void( * proc) (void * )){/ * 清理 分 量 取 值 集合 的 存储 空间 * / 

2 clrList(set->list,proc); /* 清理 链表 属性 的 存储 空间 * / 

3 free(set->list); 

4} 


程序 7-2 清理 解 向 量 分 量 取 值 集合 存储 空间 的 C 函数 


程序 中 第 2 行 调用 第 2 章 2.1.3 节 程序 2-3 中 定义 的 函数 clrList 清理 ValueSet WH 
set 的 LinkedList * 属性 list, 参 数 proc 负责 清理 list 中 每 个 结 点 的 key 属性 空间 。 

对 输出 数据 ,合法 解 向 量 用 数组 来 表示 是 合适 的 。 但 合法 解 集合 中 元 素 个 数 事前 不 可 知 ， 
故 亦 将 其 表示 为 链表 。 其 次 ,考虑 到 即使 在 一 个 组 合 问题 中 合法 解 的 长 度 未 必 相 同 ,所 以 将 合 
法 解 表示 数组 的 同时 ,还 需要 表示 出 其 长 度 。 下 列 代码 定义 了 表示 合法 解 的 数据 类 型 。 


1 typedef struct{ /* 合法 解 类 型 */ 
2 void * x; /* 解 向 量 */ 

3 int k; /=* 解 向 量 长 度 * / 
4 }Solution; 


程序 7-3 表示 合法 解 的 结构 体 类 型 
由 于 Solution 类 型 的 数据 对 象 含有 void * 类 型 属性 ,也 需要 有 一 个 负责 清理 使 用 后 存 


335 


从 算法 到 程序 (第 2 NO 


储 空间 的 函数 。 

1 void clrSolution(Solution * s){ /* 清理 解 的 存储 空间 * / 

2 if(s->x) 

3 free(s—>x); 

4) 

程序 7-4 负责 清理 Solution 类 型 数据 存储 空间 的 函数 

2) 回溯 搜索 函数 

利用 程序 7-1 和 程序 7-3 定义 的 数据 类 型 ,可 以 把 算法 7-7 的 BACKTRACKITER 过 程 实 
现 为 如 下 C PCS 

1 LinkedList * backtrackiter( ValueSet * * OMG, int n)( /* 组 合 问题 回溯 求解 * / 

2 intk=0, size=OMG[0]->list->eleSize; 

3 void * x= (void * )malloc(n * size); /* 解 向 量 */ 

4 LinkedList * solutions=createList(sizeof(Solution),NULL); /* 合法 解 集合 */ 

5 assert(x&.&solutions) ; 

6 while(k>=0){ 

7 whileCOMG[k]-»current-»next! =OMG[k]->list->nil){ / * X, 未 穷尽 * / 

8 OMG[k]-»current — OMG[k]-»current-» next ; 

9 memcpy( (char * ) x-- k * size, OMG[k]->current->key, size) ; 

10 ifCisPartial(x. k)) /* 部 分 合法 * / 

11 if(isComplete(x, k)){ /* 完整 合法 解 * / 

12 Solution s; / * 合法 解 暂 存 空 间 * / 

13 s. x— (void * )malloc((k+1) * size); 

14 memepy(s. x,x,(k+1) * size); / * 保存 解 向 量 * / 

15 s.k=k+1; /* 解 向 量 长 度 * / 

16 listPushBack(solutions, 8-5) ; / * VA EAE * / 

17 if COMG[Kk]-»current-» next! =OMG[k]->list->nil) 

18 continue; 

19 ) 

20 if(k==n—1){ / * 达到 树叶 但 非 完整 合法 解 * / 

21 if(OMG[k]->current->next= =OMG[k ]->list->nil) 

22 break; 

23 Jelse k++; 

24 } 

25 ) 

26 OMG[k]->current=OMG[k]->list->nils /* BEX, x / 

27 k=; /x 回溯 */ 

28 } 

29 free(x); 

30 return solutions; / * El ERE / 

31} 
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对 程序 7-5 的 说 明 如 下 。 

(1) 函数 backtrackiter 有 两 个 参数 ,第 一 个 参数 是 ValueSet * 类 型 数据 的 数组 OMG, 
表示 解 空 间 Q。 第 二 个 参数 n 表示 数组 OMG 的 元 素 个 数 。backtrackiter 返回 表示 为 链表 
类 型 LinkedList 的 合法 解 集合 。 

(2) 第 2 行 声明 的 inc 型 变量 k, 第 3 行 声明 的 void * 型 变量 x, 第 4 行 声 明 的 
LinkedList * 变量 solutions 的 意义 与 算法 7-7 中 的 同名 变量 是 一 致 的 : k 表示 探索 层次 ,x 
表示 解 向 量 ,solutions 表示 合法 解 集合 。 将 上 初始 化 为 0 是 因为 C 语言 中 数组 下 标 是 从 0 
开始 的 。 为 x 分 配 空间 时 用 来 表示 元 素 存储 宽度 的 size 值 初始 化 为 OMG[0]( 表 示 Xo) HY 
链表 中 元 素 存 储 宽度 。solutions 初始 化 为 调用 函数 createList 创建 的 空 链 表 。 函 数 
createList 定义 于 第 2 章 2.1. 3 节 的 程序 2-3 中 。 

(3) 第 6 一 28 行 的 while 循环 对 应 算法 7-7 中 第 3 一 14 行 的 while 循环 ,循环 条 件 变 为 
k 宇 0 是 因为 前 面 说 过 的 原因 : 将 就 C 语言 中 数组 下 标的 编码 规则 。 第 7 一 25 (I LX 
while 循环 对 应 算法 7-7 中 第 4 一 12 1109 LE while 循环 。 该 循环 的 循环 条 件 利用 OMG[k] 
的 current 属性 是 否 指向 表示 X, 的 链表 的 最 后 一 个 元 素来 表示 X, 是 否 已 经 检测 完 。 循 环 
体 中 ,第 8 GRUB 9 行 完成 算法 中 第 5 行 的 操作 zc, 7 next element in Xi. H 10 一 24 ITW if 
结构 对 应 于 算法 中 第 6 一 13 行 的 证 结构 。 其 中 第 10 行 和 第 11 行 调用 的 判断 部 分 合法 解 函 
数 isPartial 及 判断 完整 合法 解 函 数 isComplete 需要 事先 声明 其 原型 ,对 具体 的 组 合 问题 编 
写 合适 的 函数 定义 。 第 12 一 16 行 完 成 算法 中 第 8 行 的 操作 solutions<solutionsU{< x, 
Zi， ve)}。 第 20 一 23 行 的 if-else 结构 对 应 算法 中 第 10 一 13 行 的 if-else 结构 。 其 中 表 
达 式 OMG[Kk ]-»current-» next — — OMG[k ]-»list-» nil 表示 条 件 X, is exhausted, 

为 便于 重用 ,将 程序 7-1 ,程序 7-3 对 数据 类 型 ValueSet 和 Solution 的 定义 以 及 程序 7-2, 
程序 7-4 和 程序 7-5 中 各 函数 原型 的 声明 写 入 文件 夹 btrack 中 的 头 文件 combineproblem. h 
中 ,而 将 程序 7-2 Fe. 7-4 和 程序 7-5 中 各 函数 的 定义 写 入 同一 文件 夹 中 的 源 文件 backtrack- 
iter. c P, 

3) 解 m- 着 色 问题 

有 了 函数 backtrackiter, 要 解决 m- 着 色 问 题 只 需要 定义 刻画 该 问题 输入 数据 的 解 空间 
O 和 判断 部 分 合法 解 函数 is Partial. 以 及 判断 合法 完整 解 的 函数 isComplete, 然 后 调用 
backtrackiter 就 行 了 。 

对 于 一 个 图 G=<V, E>,V=(1, 2, =, n},ECVXV, 可 以 用 一 个 矩阵 (ay ) ,x, 来 表 


m. Hay = : Good ne] hii HAERERAA G IB SHORE. 例如 ,图 7-6(a) 
中 的 图 G 的 邻接 矩阵 为 

0.1 1 0 0 

10 0 1 1 

1. 00 1 1 

0 1.1 0 1 

0 1 1 1 0 


把 描述 图 G 的 邻接 矩阵 表示 为 一 个 按 行 优先 存储 (第 1 行 元 素 存 储 完 ,存储 第 2 行 元 
素 ,……) 的 一 维 数组 G 中 ,图 G 的 顶点 个 数 表 为 ,颜色 数 表 为 m。 为 使 各 函数 的 参数 表示 
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简洁 ,这 3 个 数据 对 象 均 定义 为 全 局 量 。 例 如 ,为 表示 图 7-6(a) 的 图 G 的 3- 着 色 问 题 ,有 如 
下 的 全 局 变量 Gn 的 定义 。 


int GD 一 {0,1,1,0,0， 
1,0,0,1,1, 
1,0,0,1,1, 
0,1,1,0,1, 
0,1,1,1,0)./ * 图 G 的 邻接 矩阵 * / 
n=5, /* FG 的 顶点 个 数 */ 
m=3; /* 颜 色 种 数 * / 


程序 7-6 表示 图 7-6(a) 的 图 G 的 3- 着 色 问 题 的 数据 定义 
定义 了 颜色 数 六 后 ,可 以 用 如 下 的 函数 来 构造 解 向 量 分 量 取 值 集合 X 和 解 空间 Q。 


1 ValueSet * newSet( { /* 创建 集合 Xx* / 

2 inti; 

3  ValueSet * s= (ValueSet * ) malloc(sizeof( ValueSet)) ; 
4 assert(s! — NULL); 

5 s->list=createList(sizeof(int), NULL); 

6  for(i-l;ic—m;it d) 

7 listPushBack(s-»list, &-i) ; 

8  s-»current— s-»list-»nil; 

9 return s; 

10 } 

11 ValueSet * * makeOMGO (/ * 创建 解 空间 Q * / 

12 inti; 

13 ValueSet * * OMG=(ValueSet * * )malloc(n * sizeof( ValueSet * )); 
14 assertC(OMG!=NULL); 

15  for(i-0;i-niid 4) 


16 OMGL[i]- newSetO ; 
17 return OMG; 
18 } 


程序 7-7 用 来 创建 m- 着 色 问题 输入 数据 的 C 函数 


对 程序 7-7 的 说 明 如 下 。 

COD. 第 1 一 10 行 定义 的 函数 newSet 针对 全 局 变量 m 提供 的 颜色 数量 创建 mw- 着 色 问 题 
中 解 向 量 分 量 取 值 的 集合 。 第 3 行 声明 ValueSet * 型 变量 s 并 为 其 分 配 存储 空间 。 第 5 行 
调用 函数 createList X s 的 list 属性 创建 一 个 空 链表 。 第 6 行 和 第 7 行 的 for 语句 将 {1, 2, 
S m} 添 加 到 list 中 。 第 8 行将 s 的 current 属性 初始 化 为 list 的 nil 结 点 。 由 于 
LinkedList 是 双向 链表 , 哑 结 点 nil 的 next 指针 恰 指 向 list 的 首 结 点 。 

(2) 第 11 一 18 行 定义 的 函数 makeOMG 针对 全 局 变量 n 提供 的 图 G 的 顶点 个 数 调用 
n 次 newSet 创建 mw- 着 色 问 题 的 解 空 间 。 第 13 行 声明 ValueSet * * 型 变量 OMG ,并 为 其 
分 配 可 存储 n 个 ValueSet * 型 数据 的 空间 而 形成 一 个 具有 n 个 ValueSet * 型 元 素 的 数组 。 
第 15 行 和 第 16 行 的 for 循环 调用 newSet 函数 为 数组 OMG 的 每 个 元 素 创建 一 个 分 量 取 值 
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下 面 来 编写 实现 算法 7-8 中 描述 的 刻画 m- 着 色 问 题 的 两 个 判断 过 程 。 
1 int isPartial(int * x, int k)( 

2 inti; 

3  for(i-0;ick;id- --) 

4 if(GLi* n+k]&&x(i]==x[k]) /* Gi, k) € E[G] and 2;=2 * / 
5 return 0; 

6 return 1; 

7} 

8 int isComplete(int * x, int k){ 

9 returnk==n—1; 

10 } 


程序 7-8 用 于 m- 着 色 问题 的 部 分 合法 解 判断 函数 及 完整 合法 解 判断 函数 


对 程序 7-8 的 说 明 如 下 。 

CD 第 1 一 7 行 定义 的 函数 isPartial 实现 的 是 算法 7-8 中 的 IS-PARTIAL 过 程 。 程 序 代 
码 的 结构 与 伪 代 码 的 十 分 相近 。 需 要 注意 的 是 , 伪 代 码 中 数组 下 标 从 1 开始 编码 ,而 在 C 
语言 中 ,数组 的 下 标 是 从 0 开始 编码 的 ,这 就 使 得 对 应 的 循环 条 件 边界 有 些微 妙 的 差异 。 此 
外 ,我 们 是 用 一 维 数组 按 行 优 先 表 示 和 矩阵 ,所 以 为 访问 矩阵 的 第 i 行 第 j 列 元 素 G[i, 让 ,等 
价 于 访问 数组 中 元 素 G[i * n 十 门 。 

(2) 第 8 一 10 行 定义 的 函数 isComplete 实现 的 是 算法 7-8 中 的 IS-COMPLETE 过 程 。 
利用 C 语言 中 关系 表达 式 的 特点 ,程序 代码 比 伪 代 码 更 简洁 。 

程序 7-6 一 程序 7-8 的 代码 写 在 文件 夹 btrack 中 的 源 文件 mcolor. c 中 ,读者 可 打开 此 
文件 研读 。 


7.3 子 集 树 和 排列 树 


在 7.2.3 节 中 ,把 mm- 着 色 问题 ,x 皇后 问题 子 集 和 问题 纳入 到 同一 个 算法 的 框架 内 。 
它 使 得 人 们 能 集中 精力 研究 问题 本 身 的 特征 ,从 而 提高 程序 设计 的 效率 。 然 而 ,算法 框架 的 
通用 性 是 以 算法 的 时 空 效率 作为 代价 的 : 由 于 需要 存储 解 向 量 的 个 分 量 取 值 集 合 , 当 问 
题 规模 较 大 时 ,这 是 一 个 很 大 的 空间 开销 。 事 实 上 ,很 多 组 合 问题 都 有 着 一 些 特 性 ,可 以 利 
用 这 些 特性 来 提高 算法 的 时 空 效率 。 本 节 就 两 种 最 常见 的 组 合 问题 讨论 它们 的 算法 改进 。 


7.3.1 子 集 树 问题 


1. 问题 的 理解 与 描述 


考虑 子 集 和 问题 。 其 解 是 给 定 集合 的 子 集 , 解 向 量 二 zi sy rts a> kn) EH 
0 或 1 构成 的 比特 串 ,其 解 空间 可 组 织 成 一 棵 完全 二 叉 树 。 这 时 , 称 这 棵 搜索 树 为 一 棵 子 集 
树 , 因 为 在 这 棵 树 中 ,从 树 根 到 任 一 片 叶子 的 路 径 决 定 了 一 个 解 向 量 ,而 该 向 量 决定 了 集合 
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的 一 个 子 集 : c= 1 意味 着 子 集中 选取 了 第 i 个 元 素 ;z; 二 0, 意 味 着 子 集 中 未 选取 第 i 
个 元 素 。 对 搜索 树 为 一 棵 完全 二 又 树 的 组 合 问题 我 们 称 其 为 子 集 树 问题 。 形 式 化 表 
示 为 如 下 。 

MA: 含有 nn 个 元 素 的 集合 A。 

输出 : 如 果 问 题 有 合法 解 ,输出 所 有 合法 解 。 表 示 这 些 解 的 向 量 r= <ar r 
LDH k(n) ARE € (0,1) G=1, 2,…, 上) 决定 了 A 的 一 个 子 集 。 

子 集 树 问 题 是 一 种 常见 的 组 合 问题 ,除了 前 面 介 绍 的 子 集 和 问题 ,下 列 相 容 活动 问题 也 
是 一 个 典型 的 子 集 树 问 题 。 

NATED (ars oes a) 竞争 一 个 资源 。 每 个 活动 a; 有 开始 时 间 s; 和 完成 时 间 fo 
任何 时 刻 ,资源 只 能 被 一 个 活动 所 占用 。 两 个 活动 w 和 aj ,活动 时 间 区 间 [s;,，f;) 和 [s;， 
SWE. FO Ds. /I=O. PIM a; Ma; 相 容 。 相 容 活动 问题 描述 如 下 。 

输入 ;个 活动 A 二 {a ,as，…，a,}) 的 开始 时 间 s= 二 {5 ，ss ，…，s,) 和 完成 时 间 f= 
{fis fas rms fs RARE BAS fof. 

输出 : 两 两 相 容 的 活动 组 成 的 集合 。 

例如 ,11 个 活动 如 图 7-9 所 示 。s; 表示 活动 a; 的 开始 时 间 ,/; RIR a; 的 完成 时 间 。 则 
QU la; ) aim (al ay} (as ass and lays as，as，aun} 都 是 问题 的 合法 解 。A 的 这 些 
子 集 都 可 以 表示 为 比特 串 。 例 如 , {ass ass an) WRH, 0, 0,1,0,0,0,1,0,0,1>。 
因此 ,活动 相 容 问题 可 视 为 一 个 子 集 树 问 题 。 

i 1 2 3 4 5 6 7 8 9 10 1 


j; 1 3 0 5 3 56882 12 
f 4 5 6 7 8 9 10 n 12 13 14 


图 7-9 一 组 竞争 同一 资源 活动 的 时 间 表 


2. 算法 的 伪 代 码 描 述 


1) 子 集 树 搜索 算法 
对 于 子 集 树 问 题 , 由 于 搜索 树 为 一 棵 完全 二 叉 树 ,可 以 将 搜索 过 程 加 以 简化 。 


SUBSET-TREE(n) 

1 solutions- 

2 for each 1Cisn set zi as 一 1 

34-1 上 > 从 第 1 层 开始 探索 
4 while k>1 

5 do while z, —1 


6 do z, 2,1 bz, EX={0,1} 

7 if IS-PARTIAL (2), £2, t. 2%) 上 部 分 合法 

8 then if IS-COMPLETE (215 x25 t x+) 上 合法 解 

$ then solutions*-soulutions U (ai. x25 *. 2477) 

10 if xz; —1 then continue this while loop 

1 else if k=n 上 > 达到 树叶 ,但 并 非 合法 
12 then if z, >1 

13 then exit this while loop 
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14 else &--k--1 上 > 合法 但 不 完整 ,进一步 探索 
15 gei 
16  k—k—1 bac] 


17 return solutions 


算法 7-9 在 子 集 树 中 回溯 探索 解 向 量 的 过 程 


与 算法 7-7 相 比 , 子 集 树 问题 的 解 向 量 一定 是 整 型 数组 。 由 于 解 向 量 分 量 取 值 集合 为 
确定 的 X 一 {0，1} BOCA n 个 X 作为 算法 过 程 的 参数 。 这 样 就 提高 了 空间 效率 。 事 实 
上 ,算法 7-9 更 接近 于 解决 子 集 和 问题 的 算法 7-5。 除 了 第 7 行 和 第 8 行 两 行 对 于 部 分 合 
法 解 的 判断 和 完整 合法 解 的 判断 不 同 外 ,其 余部 分 完全 一 致 。 这 两 个 不 同 点 恰好 说 明了 算 
法 7-5 是 解决 子 集 和 问题 的 算法 ,而 算法 7-9 是 用 来 解决 所 有 子 集 树 问题 的 通用 算法 。 只 
要 对 具体 的 子 集 树 问题 写 出 判断 部 分 合法 解 的 过 程 IS-PARTIAL 和 判断 完整 合法 解 的 过 程 
IS-COMPLETE ,就 可 以 调用 算法 7-9 解决 该 问题 。 下 面 以 相 容 活动 问题 为 例 ,说 明 这 一 解 题 
过 程 。 

2) 相 容 活动 合法 解 判 断 算法 

根据 对 相 容 活动 问题 的 理解 ,将 该 问题 的 解 表示 为 分 量 取 值 于 {0, 1) 的 向 量 ,第 i 个 分 
iz; — 1 则 意味 着 活动 a; 被 选择 ,zx; 二 0 表示 活动 a; 未 被 选择 。 所 谓 活动 a; Ia; 相 容 , 指 
的 是 活动 时 间 区 间 [s;， /fn[s;，/f;) 二 人 。 由 于 假定 活动 按 完成 时 间 的 升序 排列 ,所 以 a; 
5j aj 相 容 条 件 可 等 价 地 表 为 (i 二 jj) 一 (f; 三 s;)。 于 是 ,对 于 向 量 二 a.c. x7 TER A 
三 ,Xz，…，X4-1 记 部 分 合法 的 前 提 下 ,检测 其 是 否 部 分 合法 ,只 需 找到 二 x ，zz，… 
a> PRI TAREE 0 的 分 量 zx; ,计算 是 否 fimus MES ai. xs，*… ,x 二 部 分 合法 
的 前 提 下 ,检测 其 是 否 完整 合法 ,只 需 检 测 是 否 & 一 2。 据 此 ,对 活动 相 容 问题 可 以 写 出 以 下 
过 程 。 


IS-PARTIAL(21 , zo. t. Ta) 


lifz,—0 D< tis Tas es na PRA GEDA tis Tzs s xa 00 AA 
2 then return true 
3 i-—k—1 


4 whilez,—-0 DREJ za. na PR — TAS F OB) 
5 do i<-i—1< Tis Trs ts xa 

6 if ¿<0 D<0, 0, =e, 0, zi 二 必 部 分 合法 
7 then return true 

8if fis Da Ha, THE 

9 return true 

10 return false 

IS-COMPLETE( £1 + 2+ tt 2) 

1 if k=n 户 到 达 叶 子 

2 then return true 

3 return false 


算法 7-10 ”判断 相 容 活动 部 分 合法 解 及 完整 合法 解 的 算法 过 程 


很 容易 看 出 ,过程 IS-PARTIAL 的 运行 时 间 是 OC) ,而 过 程 IS-COMPLETE 的 运行 时 间 
是 0(1)。 
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3. 


程序 实现 


D 子 集 树 回溯 搜索 
利用 程序 7-3 定义 的 合法 解 类 型 Solution, 可 以 把 算法 7-9 实现 为 如 下 函数 。 


1 LinkedList * subSetTree(int n){ 
LinkedList * solutions=createList(n * sizeof(Solution) , NULL) ;/ * 合法 解 集合 * / 


2 
3 
4 
5 
6 
7 
8 
9 


10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
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int * x= (int * )malloc(n * sizeof(inD) ,k—0; 
assert  x&-&.solutions) ; 
memset(x, — 1n * sizeof(int) ) ; 
while(k>=0) { 
while xk] D { 
x[k]-- 0 ; 
ifCisPartial(x, k)){ 
if(isComplete(x, k)){ 
Solution s; 
s. x= (int * )malloc((k+1) * sizeofCint)) ; 
memepy(s. x» x» Ck-- 1) * sizeofCinD) ; 
s. k=k+1; 
listPushBack(solutions. &-s) ; 
if(x[Lk]<1) 
continue; 
} 
if(k —n—D( 
if(x[k]==1) 
break; 
Jelse k++; 


) 
x[k]7 —1; 
k——y 

} 

free(x) ; 


return solutions; 


/* X, 未 穷尽 * / 

/* 部 分 合法 * / 

/* 完整 合法 解 */ 

/* 合 法 解 暂 存 空间 */ 
/* 保 存 解 向 量 */ 

/* 解 向 量 长 度 */ 


/* 加 入 解 集 */ 
/* 本 层 尚 未 检测 完 */ 


/ * 达到 树叶 但 非 合 法 解 * / 


/* 重 置 X*/ 


/* 返 回合 法 解 集合 */ 


程序 7-9 实现 算法 7-9 的 SUBSET-TREE 过 程 的 C 函数 


对 程序 7-9 的 说 明 如 下 。 
D 由 于 仅 对 子 集 树 进行 搜索 «BE A SPE BAW RY A. RÉ subSetTree 仅 
含有 一 个 表示 解 向 量 长 度 的 参数 n。 与 backtrackiter 一 样 ,subSetTree 返回 表示 合法 解 集 
合 的 链表 。 
(2) 函数 中 声明 的 变量 solutions、k、x 的 意义 与 算法 7-9 中 的 同名 变量 一 致 。 注 意 , 第 
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5 行 调 用 库 函 数 memset? 将 x 的 所 有 分 量 初始 化 为 一 1。 

(3) 与 程序 7-5 相 比 , 仅 有 对 X 是 否 穷尽 的 检测 条 件 ( 见 第 7 47.58 16 行 和 第 20 17) 
和 对 解 向 量 分 量 赋值 方式 ( 见 第 8 13.58 25 行 ) 稍 有 改变 ,其 余 都 是 一 样 的 。 

为 便于 代码 重用 ,将 函数 subSetTree 的 原型 声明 加 入 到 文件 夹 btrack 中 的 头 文件 
combineproblem. h 中 ,并 将 该 函数 的 定义 写 和 人 同一 文件 夹 中 的 源 文件 subsettree. c 中 。 

2) 解 相 容 活动 问题 

下 面 用 程序 7-9 来 解决 相 容 活动 问题 。 首 先 ,需要 定义 描述 问题 各 个 活动 开始 时 间 和 
完成 时 间 的 数组 s、f 以 及 活动 个 数 n。 例 如 ,表示 图 7-9 中 各 个 活动 时 间 的 s、f 和 n 的 声明 
如 下 。 为 使 各 功能 函数 的 参数 简洁 ,将 这 些 变 量 定义 为 全 局 变量 。 


int s[]={1, 3, 0, 5, 3, 5, 6, 8, 8, 2, 12}, 
f[]={4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14}, 
n=11; 


有 了 这 些 数 据 的 定义 ,可 以 把 算法 7-10 中 判断 相 容 活动 合法 部 分 解 与 合法 完整 解 过 程 
实现 为 下 列 函数 。 
1 int isPartial(int * x, int k){ 
int ic k—1; 
if(x[k]= =0) 
return 1; 
while(i> —08.&.x[i]— —0) 
ESj 
if(i<0) 
return 1; 


2 
3 
4 
5 
6 
7 
8 
9 return f[i]<=s[k]; 


10} 


程序 7-10 实现 算法 7-10 中 判断 相 容 活动 合法 部 分 解 与 合法 完整 解 过 程 的 函数 


把 上 述 的 全 局 变量 s、{、n 的 定义 ,函数 isPartial isComplete 的 定义 以 及 调用 
subSetTree 解决 图 7-9 中 表示 的 相 容 活动 问题 的 程序 存储 在 文件 夹 btrack 中 的 源 文件 
compatableactives. c 中 ,读者 可 打开 文件 研读 并 试 运行 。 


7.3.2 排列 树 问 题 


l. 问题 理解 与 描述 


仔细 考察 x+ 皇 后 问题 , 解 向 量 的 第 k 个 分 量 只 能 选取 前 & 一 1 个 分 量 尚未 取 到 过 的 列 号 
值 。 换 名 话说 ,一 个 完整 的 解 向 量 恰 是 1,2,…, n 的 一 个 排列 。 然 而 ,在 7.3.1 节 中 ,将 每 
个 分 量 的 取 值 集合 设置 为 {1,2,…, n)。 因 此 ,搜索 树 成 为 一 棵 完全 叉 树 ( 见 图 7-5)。 
事实 上 ,可 以 把 六 皇后 问题 的 搜索 树 从 ” 又 完全 树 简 化 为 根 结 点 有 nn 个 孩子 ,这 些 孩子 结 点 


O ERR memset 的 原型 声明 在 头 文件 string. h P. 
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每 一 个 有 ”一 1 个 孩子 ,最 后 一 层 , 每 个 结 点 只 有 1 个 孩子 。 例 如 ,4- 皇 后 问题 简化 后 的 搜索 
树 如 图 7-10 所 示 。 


图 7-10 4- 皇 后 问题 简化 后 的 搜索 树 

把 解 向 量 是 n 个 元 素 的 排列 的 组 合 问 题 的 搜索 树 称 为 排列 树 , 而 把 这 一 类 组 合 问 题 称 
为 排列 树 问题 。 形 式 化 表示 为 如 下 。 

输入 : nn 个 各 不 相同 的 元 素 构 成 的 集合 A 二 {al, azs s an} o 

输出 : 所 有 A 的 n 个 元 素 的 排列 二 zi s rzs es mum ETE fris xs. rns x) — true. 
其 中 ,f 是 定义 在 Q 为 所 有 A 的 个 元 素 的 排列 组 成 的 集合 , 值 域 是 {true, false} 的 函数 。 

让 皇后 问题 是 典型 的 排列 树 问 题 。 由 于 排列 树 中 的 结 点 数 为 O D O, ARN E A 
过 程 耗 时 为 OC) , 则 排列 树 问 题 的 回溯 算法 耗 时 O Gn D ,这 当然 要 比 搜索 树 为 叉 完全 树 
问题 的 回溯 算法 耗 时 OC") REE 

排列 树 问题 是 一 类 常见 的 组 合 问题 ,例如 ,下 列 著名 的 Hamilton 回路 问题 也 可 以 归纳 
成 排列 树 问题 。 

Hamilton 回路 问题 : AWA G=<V. E>, H'B.V—(1.2. =, n),ECVXV。 d 
求 从 顶点 sEV 出 发 ,经 过 G 中 每 一 个 顶点 一 次 ,最 后 回 到 顶点 s 的 回路 ,如 图 7-11(a) 所 
示 , 其 中 用 带 阴影 的 边 表 示 的 就 是 该 图 中 这 样 的 一 条 路 径 。 这 个 问题 称 为 Hamilton 回路 
问题 。 不 是 每 个 无 向 图 都 存在 Hamilton 回路 ,例如 ,图 7-11(b) 中 就 不 存在 Hamilton 
回路 。 


(a) 
图 7-11 图 的 Hamilton 回路 


Hamilton 回路 问题 可 形式 化 地 描述 为 如 下 。 

GA: 具有 个 顶点 的 无 向 图 G 二 <V, E> ,起 始 顶 点 s。 

输出 : 如 果 G 具有 Hamilton 回路 ,输出 所 有 向 量 zx 王 二 zi ep cn xm KP as. 
Hes tty Ia Æ l, 2, +e, n PRT s 以 外 的 2 一 1 个 数 的 一 个 排列 , 且 ris trs ety £as xi 是 


© HE Stirling ARA n! 也 是 指数 级 的 量 。 
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G 中 的 一 条 回路 ;否则 ,输出 空 集 。 
图 7-12(a) 中 给 出 了 一 个 具有 5 个 顶点 无 向 图 G, 图 7-12(b) 展 示 了 对 G 计算 从 顶点 
s—1 出 发 的 Hamilton 回路 问题 的 搜索 树 。 


(b) 
图 7-12 ”一 个 无 向 图 的 Hamilton 回路 问题 的 搜索 树 


2. 算法 的 伪 代 码 描述 


1) 创建 排列 树 
解决 排列 树 问 题 的 前 提 是 将 解 空间 Q 构建 成 排列 树 。 下 列 的 递归 过 程 能 生成 一 棵 排 
列 树 。 


PERMUTE (z, k) 


lif kn 

2 then solutions< solutions U (xis x25 ts 2,77) 

3 return 

4 for i<-k to n 户 对 当前 第 个 分 量 逐 一 取得 各 种 可 能 的 值 
5 do z;z, 上 > 交换 x; 和 zx 

6 PERMUTE(z, k+1) 

7 aire 上 还原 = May ,准备 创建 下 一 个 不 同 的 排列 


算法 7-11 创建 个 元 素 全 排列 的 递归 算法 


算法 PERMUTE 过 程 运行 如 下 。 当 参数 & 二 n 时 ,意味 着 二 zi ，r ，…，z 二 已 构成 一 
个 排列 ,输出 后 回溯。 对 en 的 情况 ,第 4 一 7 行 的 for 循环 对 第 & 层 的 ?一 上 十 1 个 值 逐 一 
取得 ,并 递归 到 下 一 层 。 

由 于 算法 7-11 描述 的 产生 ”个 元 素 全 排列 的 递归 算法 并 非 未 尾 递归 (第 6 行 递 归 调 用 
后 还 有 第 7 行 的 交换 元 素 的 操作 ), 所 以 要 将 其 转换 成 等 价 的 迭代 版 本 需要 借助 于 栈 数据 
结构 。 

PERMUTE (origin) 

1 SØ, solutions- 


345 


从 算法 到 程序 (第 2 NO 


2 copy origin to x 
3 ke1, i<0 

4 PUSH(S, i) 

5 while £1 

6 do i<i+1 


7 while ¿<n 

8 do z;**z, 

9 if k>n 

10 then solutions< solutions U (xi 5 225 + 27) 
11 exit from this while loop 

12 kek+1 

13 PUSH(S, i) 

14 isk 

15 k-—k—1 


16  i-PoPR(S) 
17 gy tx. 


18 return solutions 


算法 7-12 ”创建 个 元 素 全 排列 的 迭代 算法 


与 算法 7-11 相 比 ,算法 7-12 含有 一 个 参数 origin, RIR n 个 元 素 的 原始 排列 。 该 过 程 
FPG MRS while 循环 模拟 递归 。 其 中 , 栈 S 扮演 递归 过 程 中 系统 栈 暂 存 层次 信息 的 角 
色 : 往 下 一 层 探索 之 前 ,第 13 行将 本 层 当 前 取 值 位 置信 息 i 压 栈 ;每 次 回 滴 前 ,将 上 层 取 值 
位 置信 息 i 出 栈 。 

2) 排列 树 回 溯 搜 索 

利用 产生 nn 个 元 素 全 排列 的 算法 框架 PERMUTE, 不 难 写 出 下 列 对 排列 树 回 溯 搜 索 的 
过 程 。 

PERMUTE-TREE(origin) 

1 SØ, solutions- Ø 

2 copy origin to x 

3 kel, i-—0 

4 PUSH(S, i) 

5 while £1 

6 do i<-i+1 


7 while in 

8 do z;**z, 

9 if IS-PARTIALGz + x25 t m) 

10 then if IS-COMPLETE(Gz; + £2% t 2) 

11 then solutions< solutionsU (xis £25 "+ 277) 
12 exit from this while loop 

13 k—ktl 

14 PusH(S, i) 

15 i<k 

16  k-—k—l 


17  i-POR(S) 
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18 xm 


19 return solutions 
算法 7-13 ”对 排列 树 回溯 搜索 过 程 


3) 解 Hamilton 回路 问题 

首先 回顾 Hamilton 回路 问题 的 输入 输出 数据 。 输 入 数 除了 表示 图 G 的 邻接 矩阵 外 ， 
还 有 一 个 作为 起 点 的 整数 *。 而 作为 输出 的 向 量 二 zi sanam n n =s 是 固定 的 。 所 
以 ,调用 算法 PERMUTE-TREE 时 ,传递 给 它 的 参数 origin 是 1, 2, +. n "PAIR s 后 的 一 
1 个 元 素 。 针 对 Hamilton 回路 问题 的 这 些 特点 , 写 出 如 下 判断 部 分 合法 解 与 完整 合法 解 
过 程 。 


JIS-PARTIALCz，A) 


lif (s, zı) € ECG) 上 > 起 点 与 顶点 不 构成 G 的 一 条 边 
2 then return false 

3 for i—1 tok—1 上 检验 < zi ，…， zi 二 的 合法 性 
4 if (a, x4.) EEG) DG, xi) RIE G 的 边 

5 then return false 


6 return true 

Is-COMPLETECr. k) 

lif k=n—1 and (z,-i. s) E€ E[G] 
2 then return true 

3 return false 


算法 7-14 刻画 Hamilton 回路 问题 特征 的 过 程 


算法 7-14 中 的 IS-PARTIAL 过 程 运 行 时 间 是 O(z),IS-COMPLETE 过 程 的 运行 时 间 
是 O(1) 。 


3. 程序 实现 


D 排列 树 回溯 搜索 
和 程序 7-9 相似 ,利用 程序 7-3 定义 的 合法 解 类 型 Solution, 可 将 算法 7-13 的 
PERMUTE-TREE 过 程 实现 为 如 下 函数 。 


1 LinkedList * permuteTree(void * origin, int size, int n){ 


2 Stack * S=createStack(sizeof(int)) ; 

3 void * x— (void * ) malloc(n * size) ; 

4 intk=0.i=—1; 

5 LinkedList * solutions— createList(n * sizeof( Solution) , NULL) ;/ * 合法 解 集合 * / 
6 — assert( x&-G.solutions) ; 

7  memcpy(x.origin.n * size) ; 

8 k—0;push(S. &-D; 

9 while(k>=0){ 

10 pts 

1 whileCi— n) ( 

12 swap((char * )x+k * size. (char * )x 十 ix size, size) ; 
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13 if(isPartial(x, k)) 

14 if(isComplete(x,k)) { 

15 Solution s; / * 合法 解 暂 存 空间 * / 
16 s. x— (void * )malloc((k+1) * size) ; 

17 memepy(s. x» x» (k-- 1) * size); /* 保存 解 向 量 * / 
18 s.k 一 k 十 1; /* 解 向 量 长 度 */ 
19 listPushBack(solutions &-s) ; /* 加 入 解 集 * / 
20 break; 

21 ) 

22 k++; 

23 push(S, &i); 

24 i-k; 

25 ) 

26 k—-—; 

27 i= * (Cint * )Cpop( S) -5key)) ; 

28 swap((char * ) x-- k * size, (char * )x+i * size, size) ; 

29 ) 

30 free(x); 


31  clrStack( S, NULL); 
32  free(S); 
33 return solutions; /* 返 回合 法 解 集合 * / 


程序 7-11 实现 算法 7-13 的 C 函数 


对 程序 7-11 的 说 明 如 下 。 

CD 和 算法 一 样 ,函数 permuteTree 有 一 个 表示 n 个 元 素 原始 排列 的 参数 origin。 参 数 
size 表示 origin 中 元 素 的 存储 宽度 。 函 数 返 回 表示 合法 解 集合 链表 。 

(2) 变量 S\x\solutions i k,n 的 意义 与 算法 过 程 中 的 同名 变量 一 致 。 其 中 , 栈 S 是 第 
2 音 2.2.2 节 程序 2-11 定义 的 Stack 类 型 。 解 向 量 x 的 类 型 定义 成 void * 是 因为 我 们 希望 
该 函数 能 处 理 不 同类 型 数据 的 排列 树 问题 。 

(3) 程序 代码 的 结构 与 算法 伪 代 码 结构 十 分 接近 。 注 意 第 12 行 和 第 28 行 调用 第 3 章 
3.1.2 节 程 序 3-3 定义 的 函数 swap, 执 行 算法 7-13 中 第 8 行 和 第 18 行 的 交换 zx; 和 zx 操作 
Li” Tho 

为 便于 代码 重用 ,将 函数 permuteTree 的 原型 声明 写 入 btack 文件 夹 的 头 文件 
combineproblem. h, 而 将 程序 7-11 存储 到 btrack 文件 夹 中 的 源 文件 permutetree. c 中 。 

2) 解 Hamilton 回路 问题 

要 解决 Hamilton 回路 问题 ,需要 用 来 表示 图 G 的 邻接 矩阵 G[, 图 G 的 顶点 个 数 n、 作 
为 起 点 的 顶点 s 以 及 1,2,…,n PRE s 后 的 个 整数 的 元 素 排 列 数组 origin, FUE m- 着 
色 问 题 时 相似 ,将 这 些 数据 定义 成 全 局 变量 , 且 将 图 G 的 邻接 矩阵 表示 成 按 行 优先 存储 的 
一 维 数组 。 


int G[]={0,1,1,1,0, 
1,0,1,0,1， 
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1,1,0,1,0, 
1,0,1,0,1, 
0,1,0,1,0), /* FG 的 邻接 矩阵 * / 
n=5, /* AG 的 顶点 个 数 * / 


s=], 
origin ]— (2, 3, 4,5}; 


做 了 这 些 数据 准备 后 ,将 算法 7-14 的 两 个 过 程 实现 为 如 下 函数 。 


1 int isPartial(int * x, int k){ 

2 inti; 

3 if(G[G—D *n+xl0]—1]==0) /* (sy x0 € EQ */ 
4 return 0; 

5  for(i—-0;i-k;it +) 
6 if GLx[i] D * n+x[li+1]—1]==0) /* Gi, zi? Ç ELG] */ 

7 return 0; 

8 return 1; 

9} 

10 int isComplete(int * x, int k){ 

11 return (k= —n—2)&.&G[(x[n-2]— D * nts—1]; /* k—n—1 and (2,-,, s) € E[G] * / 
12 } 


程序 7-12 实现 算法 7-14 的 C 函数 


对 程序 7-12 的 说 明 如 下 。 

(1) 在 Hamilton 回路 问题 的 数据 描述 中 , n 是 表示 图 G 的 顶点 个 数 。 而 调用 
permuteTree 时 ,传递 给 它 的 origin 数组 中 仅 含 剔除 s 后 的 n 一 1 个 元 素 ,要 产生 的 排列 树 
的 层 数 为 n 一 1。 所 以 , 解 向 量 x 的 长 度 为 n 一 1, 即 x[0.. n—2]. 

(2) 第 1 一 9 行 定义 的 函数 isPartial 实现 的 是 算法 7-14 中 的 IS-PARTIAL 过 程 。 图 G 
的 邻接 矩阵 元 素 GCs. zi] 的 值 表 示 〈*，zi ) 是 否 为 图 G 的 边 。 由 于 C 语言 中 数组 下 标 是 从 
0 开始 的 ,所 以 G[s, zi] 表 为 GLs 一 1][x[0] 一 1], 由 于 是 用 一 维 数组 表示 和 矩阵 ,所 以 G[s 一 
1]E xL0j 一 1j 表 为 GL CGxLi] — D * n 十 x[i 十 1 一 1]。 同 样 ,G[ (x[i] 一 1) * n 十 x[i 十 1] 一 1] 
表示 (zi ，xzi+i) 是 否 为 图 G 的 边 。 

(3) 第 10 一 12 行 定义 的 函数 isComplete 实现 算法 7-14 中 的 IS-COMPLETE 过 程 。 
根据 (1) 中 对 数据 定义 的 说 明 ,k= 一 n 一 2 表明 x[0..k] 已 经 构成 搜索 树 中 一 条 到 达 树 
叶 的 路 径 。 类 似 地 说 明 (2),G[(x[n 一 2] 一 1) x n 十 s 一 1 不 等 于 0 表示 (xz, OER G 
的 一 条 边 。 

程序 7-12 及 调用 程序 7-11 解决 Hamilton 回路 问题 的 代码 存储 在 btrack 文件 夹 的 源 
文件 hamiltoncircuit. c 中 ,读者 可 打开 研读 并 试 运行 。 


7.3.3 应 用 


本 节 讨 论 两 个 可 以 用 回溯 算法 解决 的 组 合 问题 。 
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1. Queens in Peaceful Positions 


Description 

On a chessboard of size NX N (N50) N queens are placed. We'll say that queens 
are in peaceful position if none of them can attack another. You are to find the total 
amount of peaceful positions that can be obtained from the given peaceful position by 
rearranging of exactly three queens. 

Input 

The first line of input will contain an integer number N that represents the size of a 
chessboard (and the number of queens also). It will be followed by N lines describing 
positions of queens. Each line will contain two integers X and Y separated by a space. 
These numbers represent horizontal and vertical coordinates and lay in a range from 1 
to N. 

Output 

The output consists of a single integer representing the number of peaceful positions 
that can be achieved from initial position by moving of exactly three queens. Note: queens 
are not numbered so if you rearrange them on the chessboard using only squares they 
already occupied you'll always get the same peaceful position. not the new one. 

Sample Input 

4 

21 

13 


34 
42 


Sample Output 
0 


1) 问题 的 理解 与 算法 描述 

对 给 定 规模 为 NXN 的 棋盘 上 的 一 个 N- 皇 后 问题 格局 <<zi，za，…，zxw 二 ,要 求 找 出 
该 格局 恰 移 动 3 个 皇后 的 位 置 可 得 到 六 皇后 问题 可 行 解 的 个 数 。 解 决 此 问题 的 一 个 思路 
是 计算 出 N- 皇 后 问题 的 所 有 可 行 解 ,然后 逐一 与 x 比较 ,计算 与 x 对 应 行 不 同 的 位 置 数 , 统 
计 不 同位 置 数 为 3 的 可 行 解 个 数 。 


QUEENS-IN-PEACEFUL-POSITION (con figuration) 
1 origin<<1, 2, +, N> 

2 solutions<-PERMUTE-TREE(origin) 

3 count*-0 

4 for each p € soulutions 

5 do if COMPARE(con figuration, p)=3 

6 then count count+1 
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7 return count 


算法 7-15 移动 3 个 皇后 的 位 置 后 问题 可 行 解 算法 


其 中 调用 算法 7-13 的 搜索 过 程 PERMUTE-TREE 时 需要 用 到 如 下 判断 N- 皇 后 问题 的 
部 分 可 行 解 与 完整 可 行 解 的 过 程 。 


IS-PARTIAL(2) + T29 t» Xa) 

1 for i<-1 tok—1 

2 do for j<-i+1 tok 

3 do if |x;—2z;|=li—Jj| 
4 then return false 

5 return true 

Is-COMPLETE(2) , %25 "tts 2) 
1 if k<N 

2 then return false 

3 return true 


算法 7-16 判断 N- 皇 后 问题 的 部 分 可 行 解 与 完整 可 行 解 的 算法 


此 外 ,QUEENS-IN-PEACEFUL-POSITION 过 程 调 用 的 计算 两 个 格局 的 不 同位 置 皇后 数 
的 COMPARE 过 程 伪 代 码 如 下 。 


COMPARECz，y) 
1 diffrent<-0 


2 for i-—-1 to N 
3 doif x+y; 
4 then diffrent- diffrent +1 


5 return different 


算法 7-17 COMPARE 的 伪 代码 


2) 程序 实现 
将 上 述 各 算法 实现 为 如 下 C 程序 。 


lint * origin, [x 棋盘 原始 格局 * / 
2 m / * 棋盘 规模 * / 
3 int isPartial(int * x, int k){ 

4 int i,j; 

5 for(i=O0;i<ksit++) 

6 forG=i+1;j<=k;j++) 

3 府 ((x[ 癌 一 x[ 订 一 一 j 一 D || (xD] 一 x[ 癌 一 一 j 一 D) 

8 return 0; 

9 return 1; 

10 } 

11 int isComplete(int * x, int k){ 

12 return k==n—1; 

13 } 

14 int compare(int * x, int * y){ 
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15 int i,different=0; 
16 for(i=0;i<n;it+) 


17 if x[i]!— yLiD 
18 different+ +; 
19 return different; 

20 } 


21 int main(){ 

22 inti, * configuration, x, y, count=0; 

23 LinkedList * solutions; 

24  ListNode * p; 

25 FILE * f1—fopen("chap07/Queens in peaceful positions/inputdata, txt" ,"r") , 


26 * [2— fopen(" chap07 /Queens in peaceful positions/outputdata, txt" ,"w") ; 
27  assert(f18.8.[2) ; 

28 fscanf(fl."%d",&n); 

29  assertCorigin— (int * )malloc(n * sizeofCinD)) ; 

30  assert(configuration— (int * ) malloc(n * sizeofCin )) ; 

31 for(i—0;icn;ic- 4)( 

32 origin[ i] —i4-1; 

33 ÍscanfCf1, "96d 94d", &x, &-y); 

34 configurationLy—1]— x: 

35 ) 

36 solutions = permuteTree(origin, sizeof(int), n); 

37  for(p— solutions -»nil-»next;p!-— solutions -»nil; p=p->next) ( 

38 if compare( configuration, (int * ) ((Solution * )(p->key))->x) = —3) 
39 count+ +; 

40 } 


41 fprintf({2, "%d\n", count) ; 

42 free(configuration) ;free(origin) ; 
43 clrList(solutions, clrSolution) ; 
44 — free(solutions) ; 

45  fcloseCf1) ; fclose( f2) ; 

46 return 0; 

47) 


程序 7-13 ”实现 后 的 程序 


对 程序 7-13 的 说 明 如 下 。 

(1) 第 1 行 和 第 2 行将 表示 棋盘 原始 格局 与 棋盘 规模 的 变量 origin I n 定义 成 全 局 变 
量 ,可 以 使 各 功能 函数 的 参数 比较 简洁 。 

(2) 第 3 一 10 行 定 义 的 函数 isPartial ,第 11 一 13 行 定义 的 函数 isComplete 和 第 14 一 20 FF 
定义 的 函数 compare 实现 的 是 上 述 的 同名 算法 过 程 。 代 码 结果 几乎 一 致 , 读 者 可 比较 研读 。 

(3) 第 21 一 47 行 定义 的 main 函数 ,实现 算法 过 程 QUEENS-IN-PEACEFUL-POSITION， 
解决 Queens in Peaceful Positions 问题 。 函 数 题 中 定义 的 变量 configuration, solution, 
count, p 与 算法 中 的 同名 变量 意义 一 致 。 文 件 指针 fl 、f2 分 别 指向 输入 、 输 出 文件 。 第 31 一 
35 行 的 for 循环 从 £1 中 读 取 数 据 初 始 化 conficuration ,同时 初始 化 origin。 第 36 f£r38 JH PR 
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数 permuteTree, 用 回溯 方法 解 x- 皇 后 问题 。 第 37 一 40 行 的 for 循环 对 solutions 中 的 每 个 
解 p 调用 函数 compare 计算 其 与 configuration 的 差别 ,并 用 count 计数 两 者 相差 3 个 皇后 
位 置 的 情形 。 第 41 行将 count HA {2 KF. 

上 述 程 序 存储 在 文件 夹 chap07/Queens in peaceful positions 中 的 源 文件 Queensinpeace- 
fulpositions. c 中 。 读 者 可 打开 文件 研读 并 试 运行 。 


2. Color the Map 


You were lucky enough to get a map just before entering the legendary magical 
mystery world. The map shows the whole area of your planned exploration. including 
several countries with complicated borders. The map is clearly drawn. but in sepia ink 
only; it is hard to recognize at a glance which region belongs to which country. and this 
might bring you into severe danger. You have decided to color the map before entering the 
area, “A good deal depends on preparation,” you talked to yourself. 

Each country has one or more territories. each of which has a polygonal shape. 
Territories belonging to one country may or may not “touch” each other, i. e. there may 
be disconnected territories. All the territories belonging to the same country must be 
assigned the same color. You can assign the same color to more than one country, but, to 
avoid confusion. two countries "adjacent" to each other should be assigned di. erent 
colors. Two countries are considered to be "adjacent" if any of their territories share a 
border of non-zero length. 

Write a program that finds the least number of colors required to color the map. 

Input 

The input consists of multiple map data. Each map data starts with a line containing 
the total number of territories n, followed by the data for those territories, n is a positive 
integer not more than 100. The data for a territory with m vertices has the following 
format: 

String 


aN 


“String” (a sequence of alphanumerical characters) gives the name of the country it 
belongs to. A country name has at least one character and never has more than twenty. 
When a country has multiple territories, its name appears in each of them. 

Remaining lines represent the vertices of the territory. A vertex data line has a pair of 
nonnegative integers which represent the x-and y-coordinates of a vertex. x-and y- 
coordinates are separated by a single space. and y-coordinate is immediately followed by a 


newline. Edges of the territory are obtained by connecting vertices given in two adjacent 
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vertex data lines，and by connecting vertices given in the last and the first vertex data 
lines. None of x-and y-coordinates exceeds 1000. Finally. 一 1 in a line marks the end of 
vertex data lines. The number of vertices m does not exceed 100. 

You may assume that the contours of polygons are simple, i.e. they do not cross nor 
touch themselves. No two polygons share a region of non-zero area. The number of 
countries in a map does not exceed 10. 

The last map data is followed by a line containing only a zero. marking the end of the 
input data. 

Output 

For each map data. output one line containing the least possible number of colors 
required to color the map satisfying the specified conditions. 

Sample Input 


6 
Blizid 
00 
600 
60 60 
0 60 
0 50 
50 50 
50 10 
0 10 
—1 
Blizid 
0 10 
10 10 
10 50 
0 50 
=F 
Windom 
10 10 
50 10 
40 20 
20 20 
20 40 
10 50 
—1 
Accent 
50 10 
50 50 
35 50 
35 25 
TUE 
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=f 

4 
A1234567890123456789 
00 

0 100 

100 100 

100 0 

=l 
B1234567890123456789 
100 100 

100 200 

200 200 

200 100 

=g 
C1234567890123456789 
0 100 

100 100 

100 200 

0 200 

x: 
D123456789012345678 
100 0 

100 100 

200 100 

2000 

=} 

0 


Sample Output 


4 
2 


1) 问题 理解 

一 个 国家 由 若干 个 区 域 组 成 ,每 个 区 域 的 边界 由 若干 条 直线 段 构成 一 个 多 边 形 ,边界 中 
的 线段 的 端点 在 输入 文件 中 表示 成 横 坐 标 及 纵 坐 标 (整数 ) 。 利 用 这 些 数 据 , 可 以 绘制 成 一 
幅 探 宝 图 。 为 更 清晰 地 考察 这 份 探 宝 图 ,对 地 图 着 色 。 同 一 国家 的 所 有 区 域 着 同一 种 颜色 。 
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相 邻 的 不 同 国家 不 能 着 同一 颜色 。 按 这 样 的 要 求 , 对 个 区 域 构成 的 若干 个 国家 的 地 图 进 
行 最 少 颜色 的 着 色 。 

解 本 题 的 想法 之 一 是 将 地 图 中 各 区 域 构成 的 个 国家 间 相 邻 关 系 表 示 成 一 个 图 G， 
图 7-13(a) 为 由 5 个 区 域 构成 的 4 个 城市 的 地 图 。 图 7-13(b) 表 示 图 7-13(a) 中 地 图 的 4 个 
城市 相 邻 关系 的 图 。 然 后 利用 -着 色 问 题 的 回溯 探索 算法 ( 见 7. 2. 3 节 的 算法 7-7 和 算 
法 7-8) , 按 下 列 方式 计算 出 最 少 用 色 mo 


1 m0 

2 repeat 

3 m-m+1 

4  solution*- BACKTRACKITER(G, n, m) 
5 until solutions Ø 


算法 7-18 计算 最 少 用 色 算法 


Blizid Blizid Accent 
Windom Pilot 
(a) (b) 


图 7-13 地 图 转换 为 图 


注意 ,nr 着 色 问 题 既 非 子 集 树 问题 ,也 非 排列 树 问题 ,所 以 要 用 BACKTRACKITER 过 程 
加 以 解决 。 

本 题 较 富 挑战 性 的 工作 有 两 个 : 其 一 是 如 何 将 输入 文件 中 表示 成 点 的 序列 的 区 域 转换 
成 地 图 ;其 二 是 如 何 将 地 图 转换 成 图 。 

首先 ,约定 存储 地 图 数据 的 数据 结构 如 图 7-14 所 示 。 


a | 00 IJ oo |. __| 60,10) |_| (40) 
; (60,0) (60,60) (0,10) (0,0) 
[ow ] aono]... L| 50) 
| (10,10) 7] (10,50) (0.10) 
E . | 20,20) ]. [ (40,20) ] [ 20,40) 
pu TE (4020) |] (20,40) || (20,20) 
: (0,10) |_| (30,10) (10,50) 
Windom E T^ (50,10) 77] Gate oe =] (10,10) 
(50,10) |_| (50,50) (35,25) 
Accent -1— ——* 二 一 | (50,50) T^] Sat- — — (50.10) 
fee ef Si] ALS 5.23) ] | 6550) |. | (10,50) 
Bist (85,50) Gat (35,25) 


图 7-14 图 7-13(a) 中 地 图 的 数据 表示 
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也 就 是 说 ,将 一 个 区 域 表示 成 首尾 相 接 的 多 条 线段 的 序列 ,存储 在 一 个 链表 中 。 将 从 属 
于 一 个 国家 的 所 有 区 域 存储 在 一 个 链表 中 。 最 后 将 表示 一 个 国家 的 链表 存储 为 数组 的 一 个 
元 素 。 

要 将 上 述 表示 一 幅 地 图 的 数据 结构 Ma p 转换 成 一 个 图 G( 图 的 邻接 算 阵 ) , 需 对 两 个 不 
同 的 国家 (分 别 存储 在 Ma p WR ij 个 元 素 ) 考 察 是 否 有 相同 的 边界 。 这 可 利用 在 第 5 章 
中 讨论 的 几何 算法 判断 两 条 分 属于 不 同 国家 的 区 域 边界 上 的 线段 是 否 平行 相交 (排除 平行 
相 接 的 情形 )。 有 相交 的 情形 , 令 GO, 门 为 1, 否 则 令 G[i, 门 为 0。 

2) 程序 实现 

1 typedef struct{ 


2 LinkedList * territories; 
3 char name[21]; 


4 JContry; 

5 int main(){ 

6 FILE * f1—fopen("chap07/ColortheMap/inputdata. txt" ,"r") , /* 输 入 文件 */ 
7 * [2— fopen("chap07 /ColortheMap/outputdata, txt","w"); /* 输 出 文件 * / 


8 assert(f18.8.[2) ; 
9 fscanf(f1,"%d",&n); 


10 while(n){ / * 案例 中 有 n(n>0) 个 区 域 * / 
11 LinkedList * solution=NULL; 

12 Contry * Map; 

13 Map= makeMap(f1) ; /* 将 案例 中 的 n 个 区 域 的 数据 构建 一 个 地 图 / 
14 G=map2Graph( Map); / x 将 地 图 转换 为 图 G* / 

15 clrMap(Map,n) ; free Map) ; 

16 m=0; 

17 do{ /* 从 m= 种 颜色 开始 检测 是 否 能 对 G 进行 m- 着 色 * / 
18 ValueSet * * OMG; 

19 mars 

20 OMG==makeOMGQ; — /* 构造 解 空 间 Q* / 

21 if(solution) /* 解 集 非 空 需 清 理 内 存 * / 

22 clrList(solution, clrSolution) ; 

23 solution =backtrackiter(OMG, n) ;/ * 回溯 求解 m- 着 色 问 题 / 
24 clrOMG(OMG,n, NULL); /* 清理 解 空间 Q 的 内 存 * / 

25 free(OMG) ; 

26 ) while(listEmpty(solution) ) ; /* solution=@ * / 

27 fprintf(f2,"%d\n",m); 

28 free(G) ; 

29 clrList(solution, clrSolution) ;free(solution) ; 

30 fscanfCf1, " 6d" &n); 

31 } 

32 return 0; 

33] 


程序 7-14 ”问题 的 程序 实现 
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对 程序 7-14 的 说 明 如 下 。 

CD 第 1 一 4 行 定 义 的 数据 结构 是 用 来 表示 一 个 国家 的 结构 体 。 其 中 ,字符 串 属 性 
name 用 来 表示 国家 的 名 称 ,链表 属性 territories 用 来 存储 国家 的 各 个 区 域 。 

(2) 第 10 一 31 行 的 循环 处 理 每 一 个 数据 案例 。 其 中 ,第 13 行 调用 函数 makeMap 用 输 
入 文件 fi 中 的 案例 数据 构造 地 图 Map。 第 14 行 调用 函数 map2Graph 将 Map 转换 成 表示 
图 的 邻接 矩阵 G( 按 行 优先 原则 存储 在 一 个 一 维 数组 中 )。 第 17 一 26 行 的 do-while 循环 实 
现 上 述 伪 代码 表示 repeat-until 循环 ,计算 合法 着 色 的 最 少 色 数 m。 其 中 第 23 行 调用 函数 
backtrackiter 回溯 法 解 图 G 的 m- 着 色 问 题 。 第 27 行将 算得 的 最 小 色 数 m 写 入 输出 文 
ff 12. 

(3) 为 节省 篇 幅 , 函 数 makeMap 和 map2Graph 的 定义 代码 没有 罗列 ,读者 可 打开 存储 
在 文件 夹 chap07/ Color the Map 中 的 源 文件 ColortheMap. c 研读 。 第 23 行 调用 的 是 本 章 
7.2.3 节 的 程序 7-5 定义 的 实现 算法 BACKTRACKITER 的 函数 backtrackiter, 该 函数 中 调用 
的 m- 着 色 问 题 的 isPartial 函数 和 isComplete 函数 定义 在 本 章 7. 2. 3 节 的 程序 7-8 中 ,读者 
可 参阅 。 

3. Divisibility 

Description 

Consider an arbitrary sequence of integers. One can place or — operators between 
integers in the sequence. thus deriving different arithmetical expressions that evaluate to 
different values. Let us. for example. take the sequence: 17. 5. — 21. 15. There are 
eight possible expressions: 

174-5 21+15=16 

174-5 21—15 14 

17+5——21+15=58 

17 十 5 一 一 21 一 15 一 28 

17—5+—21+15=6 

17 一 5 十 一 21 一 15 一 一 24 

17 一 5 一 一 21 十 15 王 48 

17—5——21—15—18 


We call the sequence of integers divisible by K if + or — operators can be placed 


between integers in the sequence in such way that resulting value is divisible by K. In the 
above example. the sequence is divisible by 7 (17 +5 + — 21 — 15 = — 14) but is not 
divisible by 5. 

You are to write a program that will determine divisibility of sequence of integers. 

Input 

The first line of the input file contains two integers. N and K (I< N<10000, 2< 
K<100) separated by a space. 

The second line contains a sequence of N integers separated by spaces. Each integer is 


not greater than 10000 by it's absolute value. 
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Output 

Write to the output file the word "Divisible" if given sequence of integers is divisible 
by K or “Not divisible” if it's not. 

Sample Input 


47 
175 —2115 


Sample Output 
Divisible 
1) 问题 理解 
对 给 定 的 一 组 整数 numbers[1]. numbers[2]. ++ ÓnumbersUn ] RRR 开 , 判 断 是 否 存在 
n—1 个 十 \ 一 运算 符 , 将 这 个 整数 连接 起 来 的 表达 式 的 计算 结果 能 被 K 整除 。 由 于 只 涉 
及 nn 一 1 个 十 ,一 运算 符 ,所 以 可 以 将 此 问题 的 解 视 为 向 量 z+ 二 过 zy ayy ts Ty r= 
0 BITERHXAL. 0, 5 ap ATEHE T i 
à 第 i 个 运算 符 为 1 2,，…，n 一 1)。 这 是 一 个 子 集 树 问题 ,可 以 调用 SUBSET 
TREE 过 程 解决 此 问题 。 该 问题 中 部 分 解 二 is rzs to a DHE kn 1 时 ,对 应 的 表达 式 
最 终 是 否 被 指定 的 K 整除 是 无 法 决断 的 ,所 以 只 要 kn 一 1, 就 认为 是 部 分 合法 解 。 
IS-PARTIALCz; + x?» ***s 24) 
lif k<n-1 
2 then return TRUE 
3 else return FALSE 


算法 7-19 Is-PARTIAL 算法 


而 对 于 二 xz， xs，*…， ry > RE Ag EEA HIB BR TRAM A 一 这 个 条 件 之 外 ， 
还 需 判断 最 终 的 表达 式 是 否 能 被 K 整除 。 


Is-COMPLETE(2) 5 T2, tt. 2) 
lif k=n-1 

2 then yenumbers[1] 

3 for ix-2 ton 

4 do if z[i]—0 
5 then y*—y-- numbers i] 
6 else y*- y— numbers( i] 
7 if y|K 

8 then return TRUE 

9 return FALSE 


算法 7-20 Is-COMPLETE 算法 


2) 程序 实现 
为 节省 篇 幅 , 此 处 仅 列 出 实现 上 述 判断 合法 解 过 程 的 代码 。 解 决 问题 的 完整 代码 存储 
在 文件 夹 chap07/ Divisibility 中 的 源 文件 Divisibility. c 中 ,读者 可 打开 文件 研读 。 
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1 int n, /* 案例 中 数据 个 数 * / 

2 k, /* 案 例 中 用 来 整除 表达 式 的 因子 * / 
3 * numbers; /* 存储 案例 中 Et IDCM 
4 int isPartial(void * x, int k1)( /* 部 分 合法 解 判断 * / 

5 return k1—n; 

6) 

7 int isComplete(int * x, int k1){ /* 完 整合 法 解 判断 * / 

8 if(kl==n—1){ 

9 int i,y=numbers[0]; 

10 for(i=0;i<n3it+ +){ 

11 if(x[i]— —0) 

12 yt — numbers(i4-1]; 

13 else 

14 y— =numbers[i+1]; 

15 ) 

16 return y%k==0; 

i y j 

18 return 0; 

19 } 


程序 7-15 ”问题 程序 


第 1 一 3 行 定 义 的 全 局 变量 n\k 和 numbers 分 别 用 来 表示 一 个 案例 中 的 数据 个 数 、 整 
除 表达 式 的 因子 和 存放 m 个 数据 的 数组 。 第 4 一 6 行 定义 的 函数 isPartial 和 第 7 一 19 行 定 
义 的 函数 isComplete 实现 了 上 述 的 同名 伪 代 码 过 程 。 代 码 结构 几乎 与 伪 代 码 过 程 一 致 


7.4 用 回溯 算法 解决 组 合 优化 问题 


有 了 在 组 合 问题 的 解 空间 中 进行 回溯 搜索 合法 解 的 算法 ,本 节 来 讨论 如 何 用 这 一 方法 
解决 组 合 优化 问题 。 


7.4.1 组 合 优化 问题 


如 果 组 合 问题 中 的 每 一 个 可 能 解 均 对 应 一 个 数值 ,希望 寻求 合法 解 中 对 应 数值 最 小 的 
或 最 大 的 , 则 构成 一 个 组 合 优化 问题 。 组 合 优化 问题 中 每 个 可 能 解 对 应 的 数值 称 为 该 解 的 
目标 值 , 目标 值 最 小 或 最 大 的 解 称 为 该 问题 的 最 优 解 。 下 面 通过 几 个 经 典 例子 来 说 明 组 合 
优化 问题 。 


1. 0-1 背包 问题 


设 有 种 物品 ,第 i 种 物品 的 质量 为 w; ,价值 为 vi,i 二 1, 2. …, n。 给 定 一 个 背包 ,最 
多 能 装 质量 为 C 的 物品 。 第 i 种 物品 或 放 入 包 中 ,或 留 在 包 外 。 问 将 哪些 物品 放 到 包 内 能 
使 得 包 中 所 装 物 品 总 价值 最 大 ? 其 中 ,wi co; 都 是 正 整数 ,i 二 1, 2, …, n。C 也 是 正 整数 。 若 
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"T "T (1 号 物品 放 入 包 中 
用 一 个 向 量 c n.a. tm. 思 人 来 表示 此 问题 的 解 。 其 中 = 0 ;号 物品 未 放 人 包 中 。 
则 0-1 背包 问题 可 形式 化 地 描述 为 如 下 。 

BA: HA Ww. ws “es wr} V={v s vs “ts v} ,数值 C。 

输出 : 向 量 r=, zz，…, n € (0,1) Mae i n lf 2) znw; < CVAD) ro: 最 大 。 

这 是 一 个 典型 的 组 合 优化 问题 。 所 有 2AE x m <ar T 2 >t, E (0.1). 
1<i<<n, 构 成 问题 的 解 空间 。 可 行 解 受 > rw: 三 C 限 制 且 以 >》)ziv; 为 目标 值 。 目 的 是 求 


出 可 行 解 中 的 最 优 解 一 一 目标 值 最 大 者 。 
2. 活动 选择 问题 


回顾 在 7. 3. 1 节 中 讨论 过 的 相 容 活动 问题 。n 个 具有 各 自 活动 时 间 区 间 [s;，/;) 的 活 
动 aivi 二 1, 2，…, EHP. Hla FON Ds £2 二, 则 称 aa 相 容 。 希 望 寻 
求 活动 集合 A={ a1，as，…，a,) 的 一 个 最 大 相 容 子 集合 。 若 将 该 问题 的 解 表 示 成 向 量 
1 选择 i 号 活动 "- "oT - 
=< gy cs > 其 中 = 人 不 选择 ;号 活动 "由 活动 选择 问题 可 形式 化 地 表示 为 
如 下 。 
输入 : 按 完成 时 间 排 好 序 的 活动 开始 时 间 数 组 ;完成 时 间 数 组 /, 且 活动 按 完成 时 间 
的 升序 排列 , 即 fom fom. 
输出 : 表示 一 个 最 大 的 相 容 活动 组 的 向 量 二 zi xn os a, > SE 
(A 第 i 个 活动 在 此 最 大 相 容 活 动 组 中 
^ 7 do 否则 i 
这 也 是 一 个 组 合 优化 问题 。 每 一 个 可 行 解 二 zi re os x, > ME — 4 Bf: 其 
中 不 为 0 的 分 量 个 数 。 最 优 解 是 目标 值 最 大 的 解 。 
3. 旅行 商 问题 
再 来 看 一 个 例子 一 一 旅行 商 问 题 : 商人 从 n 个 城市 中 的 一 个 出 发 ,希望 走 遍 每 个 城市 
且 每 个 城市 只 经 过 一 次 , 回 到 出 发 的 城市 。 如 果 有 这 样 的 路 径 ,要 求 找到 里 程 最 短 的 。 这 实 
际 上 是 在 要 求 最 短 的 Hamilton 回路 。 问 题 形 式 化 为 如 下 。 
输入 : 带 权 无 向 图 G— —V. E JEP V=(1, 2,…， 
n}, ECV X V; AAA w: ER。 起 始 顶 点 so 
输出 : 如 果 G 中 存在 Hamilton 回路 , 则 输出 权 值 最 
小 的 。 
这 也 是 一 个 经 典 的 组 合 优化 问题 ,每 一 个 可 行 解 是 通 
过 图 G 中 每 个 顶点 一 次 的 简单 回路 , 它 可 对 应 一 个 向 量 
Mans a.a. ct ZX, 记 ,其 分 量 构 成 1, 2, …,n 的 一 个 排列 满 
E rı=s, (zx,，s) EE[G]。 每 个 可 行 解 对 应 一 个 目标 值 : 图 7-15 一 个 带 权 无 向 图 的 最 短 
该 回路 的 长 度 (每 条 边 的 权 值 之 和 ) ,最 优 解 的 目标 值 最 小 。 Haikon FIR 
旅行 商 问题 的 一 个 例子 如 图 7-15 所 示 。 


一 1，2，…，7 
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7.4.2 用 回溯 策略 解决 组 合 优化 问题 


从 7.4.1 节 的 3 个 例子 可 见 , 对 于 组 合 优化 问题 可 以 先 将 其 视 为 组 合 问题 ,利用 回溯 算 
法 得 出 所 有 可 行 解 ,然后 计算 每 个 可 行 解 的 目标 值 ,最 终 得 到 最 优 解 。 然 而 ,如 果 跟 踪 当 前 
最 优 解 的 目标 值 mosi( 对 最 小 优化 问题 初始 化 为 >, 最 大 优化 问题 初始 化 为 一 =), 可 在 回 
溯 搜 索 过 程 中 ,对 部 分 可 行 解 x 将 其 目标 值 ooj 与 most. 比较 ,车 不 可 能 比 之 更 优 则 放弃 对 
该 分 支 的 搜索 。 对 完整 可 行 解 x, 若 其 目标 值 obj 比 most 更 优 , 则 改写 most 且 记 录 当 前 最 
优 解 。 这 样 可 以 提高 搜索 效率 。 

于 是 ,对 判断 组 合 优化 问题 的 部 分 可 行 解 的 过 程 应 该 具有 如 下 结构 。 

IS-PARTIALCz; 5 225 t. te) 

lif <2, zz, s 4 >RAKE 

2 then return false 

3 obj<-OBJ-VALUE(21 5 X25 t. te) 

4 if obj 不 可 能 比 most 更 优 

5 then return false 


6 return true 
算法 7-21 判断 组 合 优化 问题 的 部 分 可 行 解 
而 对 判断 组 合 优化 问题 的 完整 可 行 解 的 过 程 应 该 具有 如 下 结构 。 


IS-COMPLETE(Cz,; > £29 **s Ta) 

Lif <ays rey ey zs 之 不 是 完整 合法 
2 then return false 

3 if obj 不 比 most 更 优 

4 then return false 

5 most<-obj 

6 return true 


算法 7-22 解决 组 合 优化 问题 的 回溯 算法 


对 具体 问题 设计 算法 7-22 中 的 过 程 ,调用 回溯 算法 (包括 子 集 树 和 排列 树 算法 ) 就 能 解 
决 该 问题 。 注 意 在 回溯 算法 中 ,IS-COMPLETE 的 调用 总 是 在 IS-PARTIAL 之 后 ,所 以 obj 的 
计算 仅 在 IS-PARTIAL 进行 ,在 IS-COMPLETE 中 直接 引用 就 行 了 。 下 面 就 上 述 的 3 个 例子 
说 明 这 一 思想 的 运用 。 


1. 0-1 背包 问题 


对 于 0-1 背包 问题 ,其 问题 模型 属于 子 集 树 问题 ,搜索 树 形象 见 图 7-16. BGE n 件 物 
品 的 质量 和 价值 数据 存储 于 数组 w 和 w 中 。 由 于 最 优 解 是 目标 值 最 大 的 可 行 解 ,所 以 将 当 


前 最 优 解 目标 值 most 初始化 为 一 =。 记 所 有 物品 的 总 价值 oral = yw。 对 部 分 向 量 
Un. Tzs cs xd $E BE weight = D rgw. FFF Cweight C) ,计算 出 其 目标 值 
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obj => 20. 比较 obj 十 = v, 与 most 的 大 小 ,前 者 表示 n à 


当前 部 分 解 加 上 第 十 1，…，n 的 所 有 物品 的 价值 .后 者 是 X na ! 

到 目前 为 止 得 到 的 最 优 解 的 价值 , 若 前 者 不 超过 后 者 ,意味 着 — Ol 0 10 101 
PRESE 无 论 如 何 取 值 ,都 不 可 能 比 当前 的 最 优 解 更 优 ， 图 7-16 具有 3 个 物件 的 0.1 背 
故 可 放弃 。 若 前 者 大 于 后 者 ,意味 着 进一步 探索 有 可 能 得 到 包 问 题 的 搜索 空间 

比 当前 更 好 的 解 。 对 于 完整 的 可 行 解 二 zx， zs，…, > 

若 obj 记 most 意 味 着 比 当前 最 优 解 更 好 ,跟踪 此 解 。 将 此 思想 写成 伪 代 码 过 程 如 下 。 


IS-PARTIAL(Z1, T25 t mi) 
1 obj<—weight<-0, d<total 


2 for i-—1 tok 

3 do weight<-weight+ x; * wi 
4 if weight C 

5 then return false 

6 < obj + xi * v 

7 d--d— v 


8 if obj 3- d most 

9 then return false 

10 return true 
IS-COMPLETE(Cz,; + £25 tts 2%) 
lif &—n 

2 then return false 

3 if obj S most 

4 then return false 

5 most<obj 

6 return true 


算法 7-23 判断 0-1 背包 问题 中 部 分 可 行 解 与 最 优 解 的 过 程 

Is-PARTIAL 过 程 的 运行 时 间 是 O(n) ,而 IS-COMPLETE 过 程 的 运行 时 间 是 OC) 。 

由 于 0-1 背包 问题 是 子 集 树 问题 ,所 以 可 以 调用 SUBSET-TREE 过 程 解决 该 问题 。 

2. 活动 选择 问题 

活动 选择 问题 也 是 子 集 树 问题 。 与 0-1 背包 问题 相似 ,最 优 解 也 是 目标 值 最 大 的 可 行 
解 。 所 以 ,当前 最 优 解 目标 值 most 也 初始 化 为 一 号 。 对 于 部 分 解 向 量 二 zi ，zr，…， mm 
计算 目标 值 obj 为 >) zi ,以 及 最 后 一 个 不 为 0 的 分 量 下 标 i。 车 ze AO A fis ERE 
obj +n—k 5j most 的 大 小 。 前 者 表示 当前 部 分 解 加 上 后 面 所 有 活动 的 数量 ,后 者 为 当前 最 
优 解 中 活动 数量 。 若 前 者 不 超过 后 者 ,意味 着 当前 部 分 解 不 可 能 扩展 成 最 优 解 ,应 放弃 进 一 


步 探索 。 对 完整 可 行 解 ,只 要 obj most. 即 为 新 的 当前 最 优 解 ,跟踪 most。 写 成 伪 代 码 过 程 
如 下 。 


Is-PARTIAL(21 + £25 t$ 24) 
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lobj« jx 0 
2 for j--1 to £—1 
3  doifz;—l 


4 then 0bj< obj + 1 
5 ij 

6 if 立 一 1 

7 then obj<— obj+ 1 

8 if i>1 and fis, 

9 then return false 


10 if obj — most —n4-k 

11 then return false 

12 return true 
IS-COMPLETE(Cz,; + £25 "ts 2) 
1 if k<n or obj most 

2 then return false 

3 most-—obj 

4 return true 


算法 7-24 判断 活动 选择 问题 中 部 分 可 行 解 与 最 优 解 的 过 程 


与 算法 7-23 一 样 ,IS-PARTIAL 过 程 的 运行 时 间 是 O(n) ,而 IS-COMPLETE 过 程 的 运行 
时 间 是 0(1)。 

3. 旅行 商 问 题 

旅行 商 问题 是 在 Hamilton 回路 问题 的 可 行 解 中 找 出 最 优 解 ,所 以 适合 于 排列 树 搜索 。 
与 0-1 背包 问题 和 活动 选择 问题 不 同 , 旅 行商 问题 的 最 优 解 是 目标 值 最 小 的 可 行 解 。 所 以 
将 当前 最 优 解 目标 值 most 初始 化 为 co。 记 maxedge=G 中 以 ;为 端点 的 最 长 边 的 权 。 对 
TAFE s.s. tme te FE ss ans as cn 构成 图 G 的 一 条 简单 路 径 , 计 算 目 


kel 
标 值 obj = wls. xı) + > waist)» 比较 obj 53 most-maxedge 的 大 小 。 前 者 是 当前 部 


分 解 的 目标 值 , 后 者 不 超过 当前 最 优 解 的 目标 值 去 除 回路 中 封口 边 后 的 权 值 , 若 前 者 不 小 于 
后 者 , 则 过 zi ，zz，…， xx 盖 不 可 能 扩展 成 新 的 更 优 解 , 故 放弃 进一步 探索 。 对 于 完整 解 二 
ys xp. tts Ly > ef obj most 则 构成 新 的 最 优 解 ,跟踪 most。 写 成 伪 代 码 过 程 如 下 。 


IS-PARTIAL(ZT1, z:, tt. mi) 

1 if (s, zı) € ECG] 

2 then return false 

3 obj<—w(s, zi) 

4 for i--1 tok—1 

5 doif Gr, 2:41) € E[G] 
6 then return false 

7 obj*- obj +wla;, x41) 
8 if obj most-maxedge 
9 then return false 

10 return true 
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IS-COMPLETE(21 » x2 tts T) 

lif k<n—1 or (a, s) € E[G]obj most 
2 then return false 

3 obj«—obj d- wlz, s) 

4 if 0bj >most 

5 then return false 

6 most*—obj 

7 return true 


算法 7-25 判断 旅行 商 问题 中 部 分 可 行 解 与 最 优 解 的 过 程 


与 前 两 个 算法 一 样 ,IS-PARTIAL 过 程 的 运行 时 间 是 O(n) ,而 IS-COMPLETE 过 程 的 运 
行 时 间 是 0(1)。 

将 算法 7-23 一 算法 7-25 实现 为 C 函数 ,并 调用 合适 的 回溯 搜索 函数 解决 0-1 背包 问题 、 
活动 选择 问题 和 旅行 商 问 题 的 程序 分 别 写 入 btrack 文件 夹 的 源 文件 knapsack.c、 
activeselect. c 和 tsp. c 中。 为 节省 篇 幅 计 ,此 处 不 再 罗列 ,读者 可 打开 文件 研读 。 


7.4.3 应 用 


1. Calculate A Route 


Sichuan province is saturated with many beautiful. stirring and mysterious stories 
about the Three Kingdoms. Ancient Jianmen Trail is especially a good resort with both 
beautiful scenery and culture. The most exiting story. among many others. is Riding 
Alone for Thousands of Miles. an interesting description about Guan Yu. a senior 
general. who. upon hearing about the situation of his sworn brother Liu Bei. give up all 
the excellent offers by Cao Cao and embarked on the road to look for Liu. Broadsword on 
back. followed by Liu’s family, riding on his treasured horse. Guan started from Xudu, 
and finally found Liu in Gucheng after overcoming all the difficulties in his way. 

Now. your task is to design a new route for Guan Yu to find his brother. Suppose 
that Guan Yu knew all the connection between the passes from Xudo to Gucheng, and the 
probability to defeat the guards on each pass to go through safely. Please help Guan Yu 
find a successful route from Xudo to Gucheng with a maximum of probability. Guan Yu 
cannot fo to each pass twice. 

Input 

The first line of the input contains an integer T (1<T<50). T refers to the number 
of test cases followed. 

For each test case. the first line contains only one integer N (3<N<1000). The 
following N lines are a matrix representing the connections among the N-2 passes from 
Xudo to Gucheng. If the number of the i* row and the j^ column is 1. this means that 
there is a connection from i to j. Otherwise. the number of 0 means no connection from i 


to j. The last line of each test case contains N-2 real numbers separated by a single blank. 
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and each real number represents the probability P (0<P<1) of Guan Yu going through 
the pass safely. 

Output 

For each test case you should output one line containing only one real number 
representing the maximum probability of Guan Yu arrive in Gucheng safely. The real 
number is rounded to four decimal digits. If the result is less than 0. 0001, then output 
“Cannot reach!". The format of output is illustrated in Sample output. 


Sample Input 


0.5 

4 

0100 
0010 
0001 
0000 

0. 01 0. 001 
6 
011000 
001100 
000110 
001011 
000001 
000000 
0.20.10.6 0.3 


Output for the Sample Input 


Case 1; 0. 5000 
Case 2: Cannot reach! 
Case 3: 0. 1200 


1) 问题 理解 

关羽 谢绝 了 曹操 的 优厚 待遇 ,护送 刘备 夫人 从 许 都 出 发 ,过 重 关 , 越 千里 ,到 古城 寻找 刘 
备 。 对 关羽 而 言 ,如 果 从 许 都 出 发 所 到 各 关口 能 破 此 关 的 概率 是 已 知 的 ,要 计算 关羽 从 许 都 
出 发 最 有 把 握 到 达到 古城 的 路 线 。 这 个 问题 中 有 一 个 有 向 图 G== 二 V, E> ,并 给 定 图 中 
的 源 顶 点 s( 许 都 ) 和 目标 顶点 d( 古 城 ), 图 中 顶点 wEV 一 {s,d} , 均 对 应 一 个 非 负 实 数值 
0 二 p(w) 三 1( 输 入 范例 对 应 的 图 如 图 7-17 所 示 ,顶点 的 权 值 标示 在 其 旁边 , 粗 箭头 指示 出 一 
条 最 优 路 径 ) 。 为 统一 操作 ,补充 定义 p(s) 二 pl(d) 二 1。 目 的 是 在 G 中 找 一 条 从 s 到 4 的 路 径 ， 
使 得 该 条 路 径 上 的 各 顶点 对 应 的 权 值 之 积 为 最 大 。 为 表述 方便 , 设 V 二 {1, 2. …, n}, 并 设 
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s=1, d=n, WA 1 到 ?的 一 条 路 径 为 <1，z ，… 
xa n>, 路径 上 所 有 顶点 对 应 的 权 值 之 积 为 


下 ve ) .假定 用 邻接 矩阵 来 表示 图 G, 问 题 的 形式 化 


表述 如 下 。 
WA. 表示 有 向 图 G 的 邻接 矩阵 G,, 和 每 个 顶点 C 话 
的 权 值 数组 p. 图 7-17 输入 范例 3 中 的 有 向 图 G 


输出 : GPM LE ERE TL. nnm xa nm 
使 得 li PCa) 最 大 ,该 积 小 于 0.0001, 或 根本 就 不 存在 1 到 的 路 径 , 则 输出 “Cannot 
reach!" AFI, 输出 此 积 。 

这 是 一 个 组 合 优化 问题 。 从 顶点 1 出 发 到 达 任 一 顶点 的 路 径 构成 搜索 空间 。 从 Bn 
的 路 径 为 可 行 解 。 每 个 可 能 解 二 1， ris ts tes 7 一 以 ii p(x) 作为 其 目标 值 , 目 的 是 找 


到 目标 值 最 大 的 可 行 解 。 可 以 将 此 问题 的 搜索 空间 组 织 成 一 棵 高 度 不 超过 n 一 1 的 根 树 。 
根 结 点 对 应 于 最 优 路 径 起 点 1。 第 1 层 对 应 于 最 优 路 径 上 从 1 出 发 第 1 个 来 到 的 顶点 的 各 
种 可 能 的 选择 ,第 2 层 上 的 结 点 对 应 于 最 优 路 径 上 从 1 出 发 第 2 站 的 所 有 可 能 的 选 
择 ， 。 输 入 范例 3 的 搜索 树 , 如 图 7-18 所 示 。 


图 7-18 输入 范例 3 的 搜索 树 


和 旅行 商 问题 类 似 , 本 问题 寻求 G PM s(s=1) Bl n 的 一 条 无 重复 顶点 的 路 径 ,不 同 的 
是 不 必 经 过 G 中 的 每 一 个 顶点 ,并且 要 求 这 条 路 径 上 的 顶点 权重 之 积 最 大 。 可 以 用 解决 排 
列 树 模型 的 PERMUT-TREE 过 程 加 以 解决 。 

2) 算法 的 伪 代 码 描述 

用 s=1, t=n 表示 起 点 和 终点 ,mazx 来 跟踪 最 优 解 的 目标 值 ,初始 时 为 一 号 。 为 判断 
部 分 解 二 zi ， zs，…， x 二 是 否 合法 ,首先 需要 判断 ss ris rzs o x 是 否 构 成 G 中 一 条 


路 径 。 若 是 , 则 需要 计算 这 条 路 径 权 oj = II pCa). 并 检测 obj 是 否 大 于 maz 。 写 成 过 程 
如 下 。 


Is-PARTIAL(21 ，zz，…，Ze) 
lif (s, 21) ECG] 
2 then return false 
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3 obj pla) 
4 for i<-1 tok—1 
5 doif (zx;, x41) €ELG] 
then return false 
obj- obj X plas.) 
if obj maa 
then return false 


co 0 30 


10 return true 


算法 7-26 Is-PARTIAL 算法 


由 于 判断 二 zi ，zz，…，xx 盖 是 否 为 完整 合法 解 后 于 判断 其 是 否 为 部 分 合法 解 ,所 以 


只 需 检 测 是 否 (ze，z)EELG], 若 是 ,改写 maz( 找 到 了 新 的 更 优 的 解 ,其 目标 值 obj 大 于 
maz)。 写 成 伪 代 码 过 程 如 下 。 


IS-COMPLETECz; , 225 t. te) 
1 if (z[k], n) € ECG] 

2 then return false 

3 max-—obj 

4 return true 


算法 7-27 判断 是 否 为 部 分 合法 解 


3) 程序 实现 
为 节省 篇 幅 ,此 处 仅 列 出 实现 上 述 伪 代 码 过 程 的 函数 ,解决 该 问题 完整 的 程序 代码 存储 


在 文件 夹 chap07/Calculate A Route 中 的 源 文件 CalculateARoute. c 中 ,读者 可 打开 此 文件 


研读 。 
1 double * p, /* 关 隘 过 关 概 率 * / 
2 max , /* 当前 最 优 解 的 目标 值 * / 
3 obj; /* 当前 可 行 解 的 目标 值 * / 
4 int n, /* AG 的 顶点 个 数 * / 
5 s=l, /* 起 点 */ 
6 *G, /* 图 G 的 邻接 矩阵 * / 
7 *origin; /* 去 除 起 点 .终点 后 的 顶点 初始 排列 * / 
8 int isPartial(int * x, int k){ / * 部 分 可 行 解 判断 * / 
9 inti; 
10 if(G[G—D * n+x[0]—1]==0) 
11 return 0; 
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12 obj=pLxLo]—1]; 
13 for(i=0;i<k;it++){ 


14 ifC GLOx[i]— D * n+x[i+1]—1]==0) 
15 return 0; 

16 obj * —p[x[ic-1]—1]; 

17 ifCobj— — max) 

18 return 0; 

19 } 
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20 return 1; 

21} 

22 int isComplete(int * x, int k){ 

23 if (GL(xfk]—D * n+n—1]==0) 


24 return 0; 
25  if(objc-—max) 
26 return 0; 


27  max-obj: 
28 return]; 
29 } 


程序 7-16 ”问题 程序 实现 


第 1 行 定 义 的 全 局 指针 变量 p 用 来 指向 存储 各 个 关隘 的 过 关 概 率 的 数组 。 第 2 行 和 第 
3 行 定 义 的 全 局 变量 max 和 obj 用 来 表示 当前 最 优 解 的 目标 值 和 当前 可 行 解 的 目标 值 。 第 
4 行 和 第 5 行 定 义 的 变量 n A s 分 别 用 来 表示 图 G 中 的 顶点 个 数 及 起 点 (顶点 1)。 第 6 行 
定义 的 指针 变量 G 用 来 指向 图 的 邻接 矩阵 ( 按 行 优 先 原 则 存储 在 一 维 数组 中 )。 第 7 行 定 
义 的 指针 变量 origin 用 来 指向 去 除了 起 点 s=1 和 终点 n 以 外 G 中 所 有 顶点 初始 顺序 的 
数组 。 

第 8 一 21 行 定义 的 函数 isPartial 和 第 22 一 29 行 定义 的 函数 isComplete 实现 上 述 同名 
算法 过 程 ,代码 结构 与 伪 代 码 的 几乎 相同 。 


2. Graph Coloring 


Description 

You are to write a program that tries to find an optimal coloring for a given graph. 
Colors are applied to the nodes of the graph and the only available colors are black and 
white. The coloring of the graph is called optimal if a maximum of nodes is black. The 


coloring is restricted by the rule that no two connected nodes may be black. 


图 7-19 An optimal graph with three black nodes 


Input 

The graph is given as a set of nodes denoted by numbers 1... n «100. and a set of 
undirected edges denoted by pairs of node numbers (mi. n2). m Æ m. The input file 
contains m graphs. The number m is given on the first line. The first line of each graph 
contains n and k, the number of nodes and the number of edges. respectively. The 


following & lines contain the edges given by a pair of node numbers. which are separated 
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by a space. 

Output 

The output should consists of 2m lines, two lines for each graph found in the input 
file. The first line of should contain the maximum number of nodes that can be colored 
black in the graph. The second line should contain one possible optimal coloring. lt is 
given by the list of black nodes. separated by a blank. 

Sample Input 

1 

68 

12 

13 

24 

25 

34 

36 

46 

56 


Sample Output 


3 
145 


1) 问题 理解 

Xi AW G=<V, E>,V={1, 2. =, n) ,ECVXV, 用 黑白 两 色 对 顶点 涂 色 ,要求 
两 个 相 邻 顶点 不 能 同 涂 黑色 。 寻 求 最 佳 涂 色 方案 : 黑色 顶点 最 多 。 该 问题 的 解 可 视 为 向 量 
0 第 i 个 顶点 涂 白色 _ 
1 第 i 个 项 点 涂 黑色 
树 模型 的 SUBSET-TREE 过 程 加 以 解决 。 问 题 中 判别 二 zi xs，… ,x 二 是 否 为 合法 部 分 解 
的 伪 代 码 过 程 如 下 。 


1,2,…,n), 因 此 可 以 用 基于 子 集 


r—n $ Bee "3 E E ES 


IS-PARTIAL(z; , T2, t. mi) 

lobj«-0 

2 for i-—-1 to £—1 

3 do if (zx;, zi) € E[G] and z;=1 and z, —1 D z; x, 相 邻 且 均 为 黑色 


4 then return false 
5 obj~< obj +2; 
6 if obj +n—k<max 户 即 使 加 上 后 面 的 n 一 k 个 黑色 顶点 均 无 法 赶 上 当前 的 最 优 解 


7 then return false 
8 return true 


3k 728 ”判断 是 否 为 合法 解 的 算法 
对 部 分 合法 解 二 zi ，zz，… ,mi 二 判断 其 是 否 为 完整 合法 解 的 过 程 如 下 。 
IS-COMPLETE(z,; 5 225 t. Ta) 
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lif &—n 
2 then return false 
3 max-—-obj 


4 return true 


算法 729 判断 部 分 合法 解 是 否 是 完整 合法 解 的 算法 


2) 程序 实现 

为 节省 篇 幅 , 此 处 仅 列 出 实现 上 述 判 断 合法 解 过 程 的 函数 。 解 决 本 问题 完整 的 程序 代 
码 存 储 在 文件 夹 chap07/ Graph Coloring 中 的 源 文件 Graph Coloring. c 中 ,读者 可 打开 该 
文件 研读 。 

lint *G, 


2 n 


3 max=0, 


4 obj; 

5 int isPartial(int* x, int k)( /* 部 分 合法 解 判断 * / 
6 inti; 

7 for(i=0,obj=0;i<ksit++){ 

8 obj- — x[i]: 

9 if G[i * n+k]&.&.x(i] — —18.&.x[k]—- — D 

10 return 0; 

M. 

12 if(obj+n—k<= max) 

13 return 0; 


14 return 1; 


15] 

16 int isCompleteCint * x, int k){ /* 完 整合 法 解 判断 * / 
17 inti; 

18 if(_k<n—1) 

19 return 0; 

20  max—obj; 

21 return]; 

22] 


程序 7-17 Graph Coloring 源 程 序 
第 1 一 4 行 定 义 的 指针 变量 G 指向 图 的 邻接 矩阵 ,变量 n 表示 图 G 的 顶点 数 ,变量 obj 
和 max 分 别 表 示 当 前 解 的 目标 值 和 当前 最 优 解 的 目标 值 。 
第 5 一 15 行 定义 的 函数 isPartial 和 第 16 一 22 行 定义 的 函数 isComplete 实现 的 是 上 述 
的 同名 过 程 代码 结构 ,它们 几乎 完全 一 致 。 
3. Communication System 


Description 
We have received an order from Pizoor Communications Inc. for a special 


communication system. The system consists of several devices. For each device. we are 
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free to choose from several manufacturers。Same devices from two manufacturers differ in 
their maximum bandwidths and prices. 

By overall bandwidth (B) we mean the minimum of the bandwidths of the chosen 
devices in the communication system and the total price (P) is the sum of the prices of all 
chosen devices. Our goal is to choose a manufacturer for each device to maximize B/P. 

Input 

The first line of the input file contains a single integer 7 (1-410). the number of 
test cases. followed by the input data for each test case. Each test case starts with a line 
containing a single integer n (1<n<100), the number of devices in the communication 
system, followed by n lines in the following format: the i-th line (1<i<n) starts with m; 
(15m, 100). the number of manufacturers for the i-th device. followed by m; pairs of 
positive integers in the same line. each indicating the bandwidth and the price of the device 
respectively. corresponding to a manufacturer. 

Output 

Your program should produce a single line for each test case containing a single 
number which is the maximum possible B/P for the test case. Round the numbers in the 
output to 3 digits after decimal point. 

Sample Input 

1 

3 

3 100 25 150 35 80 25 


2 120 80 155 40 
2 100 100 120 110 


Sample Output 
0. 649 


1) 问题 理解 

一 个 网 络 系统 由 并 个 设备 组 成 ,第 COLS Eo A BEACH. m 个 供应 商 , 其 中 第 jA 
mi) 个 供应 商 提 供 的 设备 带宽 为 by (单位 : bps) ,价格 为 py (单位 : 元 )。 对 每 一 个 设备 选择 
一 个 供应 商 ,使 得 个 设备 的 B/P 最 大 。 其 中 ,B 表示 个 设备 中 带宽 最 小 者 的 带宽 ,P 表 
示 所 选 的 这 个 设备 价格 之 和 。 

本 问题 可 视 为 解 空间 Q 王 Xi XXasX…XX,, 其 中 Xi 一 {1, 2,…, m} (i=1, 2,…,n) 
的 组 合 优化 问题 。 解 向 量 — <a, es vrs x, > WE B==min {biz sbr, bu) P = 


p pa;，B/P 最 大 。 显 然 此 问题 既 非 子 集 树 类 型 , 亦 非 排列 树 类 型 ,所 以 需要 调用 


BACKTRACKITER 过 程 求 解 。 
由 于 本 问题 中 解 的 目标 值 必须 在 个 分 量 确定 后 才能 算得 ,所 以 部 分 解 二 zi ，zz，…， 
Zz 二 合法 的 判断 只 需 检测 kn, M k=n 时 ,需要 计算 出 B— min (bis sbr bu 1 
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P -X ba, 的 商 B/P 作为 解 的 目标 值 oo ,并 与 max 比较 ,决定 是 否 得 到 新 的 最 优 解 。 写 
成 伪 代 码 过 程 如 下 。 


Is-PARTIAL(21 , 225 t. mi) 
lif kn 

2 then return true 

3 return false 

IS-COMPLETE(z,; » 22+ t" 2%) 
lif k<n 

2 then return false 

3 Bemin (bi, sox, bu) 


4 P^ 2) pe 
iei 
5 obj<-B/P 
6 if obj — max 
T then return false 
8 max-—-obj 


9 return true 


算法 7-30 ”最 优 和 解 算 法 


2) 程序 实现 
此 处 仅 列 出 实现 上 述 算法 过 程 的 函数 代码 ,完整 程序 代码 存储 在 文件 夹 chap07/ 
Communication System 中 的 源 文件 CommunicationSystem. c 中 ,读者 可 打开 此 文件 研读 。 


1 int n, * m=NULL, * * b2 NULL, * * p- NULL; 
2 int isPartial(int * x. int k){ 

3 return kn; 

4) 

5 int isComplete(int * x, int k){ 

6 int minb=INT_MAX,sump=0, i; 

7 ifíkcn—1) 

8 return 0; 

9 forG=0;i<n;i++){ 

10 sump+ = pli] x[i]]; 


11 if bi] Ux Li] ]— minb? 
12 minb—b[ i] xLi]]; 
13 ) 


14 obj= (double) minb/sump; 
15 if(objc—max 

16 return 0; 

17 max=obj; 

18 return 1; 

19 } 


BF 7-18 ”问题 程序 实现 
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第 1 行 中 定义 的 变量 n 表示 设备 数 ,指针 变量 m 指向 存储 各 设备 的 供应 商 数 的 数组 。 
指针 变量 b 和 p 分 别 指向 存储 各 设备 的 各 供应 商 提 供 设备 的 带宽 数组 和 价格 数组 。 

第 2 一 4 行 定义 的 函数 isPartial 和 第 5 一 19 行 定 义 的 函数 isComplete 实现 的 是 上 述 的 
同名 算法 过 程 ,代码 结构 几乎 一 致 。 
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在 第 7 章 中 ,介绍 了 解决 组 合 优化 问题 的 直接 方法 是 “回溯 算法 ”: 搜索 组 织 成 根 树 的 
问题 的 解 空间 ,并 计算 可 行 解 的 目标 值 ,从 中 选取 具有 最 优 值 的 解 。 然 而 ,很 多 组 合 优化 问 
题 的 解 空间 是 无 限 的 。 即 使 问题 的 解 空间 是 有 限 集合 ,其 中 的 元 素 个 数 很 可 能 是 巨大 的 。 
此 时 ,回溯 算法 将 会 陷入 一 个 “时 间 黑 洞 "。 如 何 有 效 地 解决 组 合 优化 问题 是 计算 机 技术 的 
一 个 既 传 统 又 现实 的 研究 应 用 领域 。 研 究 思路 之 一 是 发 掘 问题 本 身 的 特性 ,针对 特性 利用 
特殊 的 算法 策略 设计 有 效 算法 。 本 章 中 针对 一 类 具有 “最 优 子 结构 "性质 及 “ 子 问 题 重 倒 ”性 
质 的 组 合 优 化 问题 来 讨论 一 种 解决 问题 的 算法 设计 策略 一 一 “动态 规划 ”。 


1. 最 优 子 结构 


最 优 子 结构 特性 是 指 问题 的 最 优 解 包含 的 子 问题 的 解 相对 于 子 问题 而 言 也 是 最 优 的 。 
例如 ,考虑 如 下 最 短路 径 问 题 。 

已 知 有 向 图 G— —V E> RIBUS wo V. JEn A u Slo 的 由 最 少 的 边 构成 的 路 径 ( 也 
JÈ GPM u 到 v、 经 过 最 少 中 间 顶 点 的 路 径 。 这 是 通信 网 络 中 两 结 点 间 的 数据 传送 经 过 最 
少 中 间 结 点 转发 的 信道 问题 的 模型 )。 显 然 , 这 样 的 路 径 必 为 简单 路 径 , 这 是 因为 从 路 径 上 
删除 一 个 环 将 使 得 路 径 包含 的 边 更 少 。 假 定 从 wx 到 v 存在 这 样 的 一 条 最 短路 径 p = 
Coy oy sw) Hiro, Suson v. IFEX 1nd pim Co ou) Al po Coi to, W 
的 长 度 等 于 py 的 长 度 与 po 的 长 度 之 和 。 人 们 断言 , 记 和 ps 分 别 是 G P u 到 w; 的 最 短 
路 径 和 w; 到 w 的 最 短路 径 。 下面 ,说 明 p. 是 G 中 到 wi 的 最 短路 径 , 对 于 po ,得 相同 结 
论 ,读者 可 仿照 说 明 。 假 定 pi 不 是 G P u 到 w; 的 最 短路 径 , 设 pi 是 G 中 到 wi 的 一 条 最 
短路 径 , 当 然 有 pi 的 长 度 小 于 pi 的 长 度 。 将 pt 和 ps 相连 (pi 的 末尾 顶点 与 p» 的 首 顶 点 都 
是 vo ,得 到 一 条 新 的 从 wx Blo 的 路 径 p' 且 其 长 度 为 pi 的 长 度 与 p. 的 长 度 之 和 。 这 样 ,就 
可 推 得 p 的 长 度 小 于 p 的 长 度 。 这 与 p 是 G 中 Slo 的 一 条 最 短路 径 矛 盾 。 

组 合 优化 问题 的 最 优 子 结构 揭示 了 该 问题 的 最 优 解 与 其 子 问题 的 最 优 解 之 间 的 关系 。 借 
助 这 个 关系 ,可 以 考虑 如 何 通过 解决 子 问题 来 达到 解决 问题 的 本 身 。 需 
要 注意 的 是 并 非 所 有 的 组 合 优化 问题 都 具有 最 优 子 结构 特性 。 例 如 , 同 
样 在 有 向 图 Go —V E> (p IE A, u F) vo 的 包含 最 多 条 边 的 简单 路 径 
(也 是 G 中 从 x 到 vw, 经 过 最 多 中 间 顶 点 的 简单 路 径 。 这 是 旅游 时 经 过 
最 多 景点 的 游玩 路 径 问题 的 模型 )。 这 是 一 个 组 合 优化 问题 但 它 不 具有 ”图 8-1 有 向 图 顶点 
最 优 子 结构 特征 ,我 们 用 一 个 例子 加 以 说 明 , 如 图 8-1 所 示 。 间 的 路 径 

在 图 8-1 中 ,路 径 g 一 ~ 一 上 是 dg 到 1 的 最 长 简单 路 径 , 但 子路 径 
gr 却 不 是 g 到 的 最 长 简单 路 径 ,子路 径 一 ~: 也 不 是 ~ 到 1 的 最 长 简单 路 径 。 


2. fmm 
由 于 问题 具有 最 优 子 结构 特性 ,很 自然 地 想到 用 分 治 算法 : 递归 解 子 问题 的 最 优 解 , 然 
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后 合并 成 问题 的 最 优 解 。 然 而 ,问题 往往 没有 那么 简单 。 首 先 ,最 优 子 结构 是 在 已 知 问题 最 
优 解 的 前 提 下 说 明 其 与 子 问题 最 优 解 之 间 的 关系 。 因 此 ,要 由 子 问题 的 最 优 解 得 到 问题 的 
最 优 解 ,需要 把 问题 分 解 成 各 种 可 能 的 子 问 题 组 合 情 形 进 行 考察 。 在 对 各 种 可 能 的 子 问 题 
分 解 情形 的 考察 过 程 中 ,有 可 能 对 低层 的 子 问题 反复 进行 计算 。 此 时 ,说 该 最 优化 问题 具有 
重 友子 问题 特性 。 

针对 具有 上 述 两 个 特征 的 组 合 优化 问题 ,动态 规划 算法 通常 需要 做 如 下 三 步 工作 。 

CD 利用 最 优 子 结构 定义 一 个 关于 解 的 目标 值 的 递归 方程 。 鉴 于 子 问题 的 重 释 性 ,如 
果 自 顶 向 下 地 用 递归 技术 解 每 一 个 遇 到 的 子 问 题 , 则 会 反复 解 低层 的 子 问题 。 

(2) 因此 ,动态 规划 以 自 底 向 上 地 对 每 个 新 产生 的 子 问题 仅 解 一 次 且 将 其 解 保存 在 一 
个 表格 中 ,需要 时 可 以 在 表 中 查找 , 且 能 在 常数 时 间 内 完成 查找 。 

(3) 根据 计算 出 的 最 优 解 的 值 构 造 对 应 的 最 优 解 。 

本 章 将 运用 动态 规划 策略 解决 几 个 经 典 的 组 合 优化 问题 。 


8.1 组 装 线 调 度 问 题 


8.1.1 问题 描述 


先 用 动态 规划 策略 解决 一 个 生产 问题 。 某 汽车 公司 在 一 个 工厂 里 生产 汽车 ,这 个 工厂 
有 两 条 组 装 线 , 如 图 8-2 所 示 。 一 台 汽 车 底盘 从 入 口 进入 组 装 线 , 经 过 若干 次 零件 装配 , 完 
成 的 汽车 从 组 装 线 的 末端 出 厂 。 每 一 条 组 装 线 及 道 工序 ,编号 为 j 二 1,2,…,n。 把 第 i 号 
组 装 线 ( 其 中 i 为 1 或 2) 上 的 第 j 道 工序 表 为 5;,;。1 号 线 上 的 第 j 道 工 序 (S1,;) 与 2 号 线 
上 的 第 j 道 工序 (S;,;) 做 的 工作 是 一 样 的。 然而 ,由 于 工作 台 的 建造 时 间 以 及 技术 不 同 , 每 
道 工序 所 需 的 时 间 不 同 , 即 使 分 处 于 两 条 组 装 线 上 编号 一 样 的 工序 也 是 如 此 。 用 au; RIR 
在 工序 S;,; 所 需 的 装配 时 间 。 如 图 8-2 所 示 ,底盘 从 人 口 进入 一 条 组 装 线 的 1 号 工作 台 , 然 
后 从 一 道 工 序 行进 到 下 一 道 工 序 。 底 盘 进 入 i 号 组 装 线 ( 进 入 时 间 e) ,完成 的 汽车 从 i 号 组 
装 线 出 厂 ( 出 厂 时 间 x), 


工序 Si LFS). 工序 33 LFS. 4 IHS,. IHS, 


IS, IFS  IH$; INS. IHS, ^ LH$, 
图 8-2 组 装 线 
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图 8-2 所 示 为 找 出 工厂 中 最 快 路 线 的 一 个 生产 问题 。 有 两 条 组 装 线 ,每 一 条 有 交道 工 
序 ;i 号 线 上 的 第 j 号 工序 表 为 5;,; ,在 此 工序 所 用 的 装配 时 间 为 ai,;。 汽 车 底盘 进入 第 i 号 
组 装 线 耗 时 e;, 通 过 一 条 线 上 的 第 j 号 工序 后 ,底盘 可 进入 任 一 条 线 的 第 j 十 1 道 工序 。 若 
继续 在 同一 条 线 上 则 没有 转移 开销 ,但 若 从 S;,; 转 移 到 另 一 条 线 上 则 要 耗 时 4i,;。 通 过 n 工 
序 装配 完成 的 汽车 从 第 i 条 线 出 厂 耗 时 x;。 问 题 是 要 确定 从 1 号 线 上 选择 哪些 工作 台 , 从 
2 号 线 上 选择 哪些 工作 台 使 得 一 辆 汽车 通过 工厂 的 时 间 最 少 。 

一 台 底 盘 从 入 口 到 出 口 必须 通过 所 有 n 道 工 序 才能 完成 组 装 。 可 以 在 一 条 线 上 完成 
n 道 工序 ,也 可 以 在 两 条 线 上 来 回 切 换 完成 道 工序 。 在 一 条 线 上 从 一 个 工序 到 下 一 个 工 
序 ,转移 时 间 可 忽略 不 计 , 而 要 在 两 条 线 之 间 转 移 则 需要 耗费 转移 时 间 。 底 盘 完 成 S;, 工 序 
后 从 一 条 线 上 转移 到 另 一 条 线 上 的 耗 时 为 4,; ,其 中 i 1.2 WR j— 1.2 n - 108 n i 
工序 后 组 装 才 完成 )。 问 题 是 要 确定 从 1 号 线 上 选择 哪些 工序 ,在 2 号 线 上 选择 哪些 工序 使 
得 汽车 通过 工厂 的 时 间 最 少 。 在 图 8-3(a) 的 例子 中 ,从 1 号 线 上 选择 工序 1、3、6, 在 2 号 线 
上 选择 2、4、5 号 工序 所 需 时 间 最 短 。 


ISa 工序 S, >。 IS, IS, INS. IS 


LFS, TPS). 工序 $,， 工序 S INS: IS, 
(a) 


(b) 
图 8-3 ”组装 线 问题 实例 


一 般 地 ,组 装 线 问题 描述 如 下 。 

输入 : 两 条 组 装 线 上 的 工序 数 ,组 装 线 上 各 道 工序 操作 时 间 构 成 的 矩阵 a, 底盘 在 两 
条 组 装 线 间 转移 时 间 构 成 的 矩阵 ,底盘 从 入 口 进入 组 装 线 所 需 时 间 构 成 的 向 量 e, 完 成 组 
装 后 汽车 下 线 出 厂 的 时 间 构 成 的 向 量 x。 

输出 : Hp n 道 工序 构成 的 序列 {Si a Sio Sin} € {1,2),p 二 1,2,…,n, 使 得 底 
盘 按 此 序列 完成 组 装 所 需 时 间 最 少 。 

底盘 从 入 口 到 组 装 完成 出 厂 ,序列 Sia eSa t ,Si 中 的 每 一 道 工序 S; ,可 以 是 两 条 
组 装 线 中 的 任 一 条 上 的 。 根 据 乘法 原理 知 Si .Si.s,…,S;,., 共 有 2" 个 不 同 的 情形 。 所 以 ， 
本 问题 的 解 空间 含有 2" 个 可 能 解 ,每 个 解 对 应 确定 的 组 装 时 间 , 我 们 希望 算得 所 用 时 间 最 
少 的 组 装 路 线 。 这 是 一 个 组 合 优化 问题 ,通过 罗列 所 有 可 能 的 通过 工厂 的 路 径 来 确定 最 快 
的 路 径 的 “强力 ”算法 将 需要 Q(2") 的 时 间 , 当 郊 很 大 时 这 是 不 可 行 的 。 下 面 用 动态 规划 的 
策略 来 解决 此 问题 。 
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8.1.2 算法 设计 与 分 析 


1. 最 优 子 结构 


动态 规划 策略 的 第 一 步 是 筹划 最 优 解 的 结构 。 对 于 组 装 线 问题 ,可 以 如 下 来 完成 这 一 
步 工 作 。 考 虑 底盘 从 起 点 起 通过 Si 的 最 优 路 径 。 若 j 一 1, 已 走 过 的 路 径 是 唯一 的 ,所 以 很 
容易 确定 通过 S1,;-1 所 用 的 时 间 。 然 而 ,对 于 j 二 2,3,…,n, 有 两 种 选择 : 从 S, TJ feli] 
一 条 线 直接 到 S51, 工序 ,从 上 一 道 工序 j 一 1 转移 到 工序 j 的 时 间 被 忽略 。 另 一 个 情况 是 , 底 
盘 可 能 来 自 S2,;-1 且 转移 到 S1,; 的 时 间 为 12,;-1。 下 面 将 分 别 考虑 这 两 可 能 性 ,尽管 它们 有 
很 多 相同 的 地 方 。 

首先 ,假定 通过 工序 $1, 的 最 快 路 径 经 过 工序 S1,;_1 。 关 键 是 要 看 到 该 路 经 中 从 起 点 开 
始 到 工序 Si 一 这 一 段 是 最 快 的 ,为 什么 ?” 车 有 一 条 到 Si,;-1 的 最 快 路 径 ,可 以 把 这 条 最 快 
路 径 代 换 到 通过 Si 的 最 快 路 径 中 将 导致 一 条 更 快 的 通过 S1,; 的 路 径 ,这 是 一 个 矛盾 。 

类 似 地 ,假定 通过 S51, 的 最 快 路 径 经 过 S;,;-1。 现 在 注意 到 路 径 中 底盘 从 起 点 开始 到 
Ss,j-1 的 一 段 是 最 快 的 。 理 由 是 一 样 的 : 如 果 还 有 一 条 从 起 点 起 到 S;,;_1 更 快 的 路 径 , 则 将 
其 替换 到 经 过 Siv 的 最 快 路 径 ,将 导致 一 条 经 过 Si,; 的 更 快 的 路 径 , 这 将 是 一 个 矛盾 。 

利用 最 优 结构 ,能够 从 子 问题 的 最 优 解 来 构造 原 问 题 的 最 优 解 。 对 于 组 装 线 调 度 而 言 ， 
考察 通过 S1,; 的 最 快 路 径 , 它 必 通 过 1 号 线 或 2 号 线 的 第 j 一 1 道 工序 。 于 是 ,通过 的 最 快 路 
径 是 如 下 两 者 之 一 。 

CD 此 最 快 路 径 通过 S1,;_1 且 直接 通过 S. 

(2) 此 最 快 路 径 通 过 S. 并 从 2 号 线 转移 到 1 号 线 ,然后 通过 Sijo 

利用 对 称 性 推出 ,通过 S;,; 的 最 快 路 径 为 下 列 两 者 之 一 。 

© 此 最 快 路 径 通过 S,;_1 且 直接 通过 Si. 

C) 此 最 快 路 径 通 过 S, a JE 1 号 线 转移 到 2 号 线 , 然 后 通过 S. 

为 解 通过 两 条 线 上 第 j 道 工序 的 最 快 路 径 , 解 通过 两 条 线 上 第 j 一 1 道 工 序 的 最 快 路 径 
的 子 问题 。 


2. 最 优 解 值 的 递归 方程 


接 下 来 动态 规划 策略 是 用 子 问 题 最 优 解 的 值 递归 地 定义 最 优 解 的 值 。 对 于 组 装 线 调度 
问题 ,把 求 通过 两 条 线 上 第 j(j 二 1,2,….n) 道 工序 的 最 快 路 径 作为 子 问 题 。 设 f[i, 门 表示 
底盘 从 起 点 到 通过 工序 5;,; 的 可 能 的 最 短 时 间 。 

我 们 的 最 终 目标 是 确定 底盘 通过 全 厂 的 最 短 时 间 , 用 f* 来 表示 。 底 盘 必 须 经 过 1 号 线 
或 2 号 线 上 的 道 工序 ,然后 出 厂 。 由 于 这 两 条 线路 的 较 快 者 为 通过 全 厂 的 最 快 路 径 , 所 
以 有 


f' = minCf[ 1.5] +a, fln] +22) (8-1) 

推导 FL1,1] 及 FL2,.1] 很 容易 。 底 盘 是 直接 通过 两 条 线 的 第 1 道 工序 的 。 于 是 
fl1:1] = @ +a (8-2) 
fI2:1] = e Fan (8-3) 
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图 8-3(a) 指 定 开销 ei sai; 及 zi 的 组 装 线 问题 实例 。 粗 线路 径 表示 通过 工厂 的 最 快 
路 径 。 图 8-3(b) 部 分 为 图 8-3(a) 中 实例 的 FL; 1 DIRT 的 值 。 

现在 来 考虑 如 何 计算 f[i, 门 ,j 二 2,3,…,n (并 且 i 二 1,2)。 着 重 于 /[1, 门 ,回忆 通过 
工序 51, 的 最 快 路 径 或 者 是 经 过 Sij 1 工序 然 后 直接 到 达 工 序 S,; ,或 经 过 Ss,;_1, 从 2 号 线 
转移 到 1 号 线 , 然 后 通过 S1,;。 对 第 一 种 情形 ,有 j] f[j 一 1] 十 a1,;; 而 对 于 后 者 ， 
f[1, 站 = 了 [2,j 一 1] 十 tz ;ji1 十 a1jy。 于 是 ,对 j=2,3,…,n， 


fL1,j] = minCf[1.j — 1] - ai; f/E2.j — 1] - 64a +t a) (8-4) 
对 称 地 ,对 j= 二 2,3,…,n， 
f[2.j] = min fl2,j — 1] + as, fll j —1]+ tj Hazy) (8-5) 
合并 式 (8-2) 一 式 (8-5) 得 到 递归 式 : 
el 十 ai J= 
1,j] = (8-6 
fis) 5. GLbg —1)- E 457255 — he beu 322 i 
ez 十 az j—1 
2 8-7 
fl2,j] bus i taste gee CU 


图 8-3(b) 展 示 了 利用 式 (8-6) 及 式 (8-7) 计 算 的 图 8-3 GO BSP PAF fij MEM £7 
的 值 。 

值 f[i, 门 给 出 了 子 问 题 最 优 解 的 值 。 为 跟踪 如 何 创建 最 优 解 ,定义 Lij 1A XE S; 
的 最 快 路 径 经 过 第 j 一 1 道 工 序 时 所 在 的 组 装 线 号 ,1 或 2。 此 处 i=1,2 以 及 j=2,3,…,n 
(不 定义 L[i,1] 是 因为 工序 1 的 前 序 不 存在 ) ,还 定义 1" 为 通过 全 厂 的 最 快 路 径 经 过 的 第 
n 道 工 序 所 在 的 组 装 线 号 。/[i, 门 的 值 可 以 用 来 跟踪 一 条 最 快 路 径 。 利 用 图 8-3(b) 中 展示 
的 2 及 4L[i,j] 的 值 ,可 以 如 下 追踪 图 8-3(a) 部 分 的 一 条 最 快 路 径 。 从 1* = 1 开始 ,用 到 
Sie。 考 察 上 [1,6], 其 值 为 2, 所 以 用 到 S。.; 。 继 续 考察 12,5] =20NB S24) ,li[2,4]==1( 工 
序 Si,:),/[1,3] 王 2( 工 序 S:,:) ,以 及 虑 2,2] 王 1( 工 序 Su ) 。 


3. 计算 最 短 时 间 

此 时 ,可 以 用 一 个 简单 的 方式 写 出 一 个 基于 式 (8-1) 及 式 (8-6) 和 式 (8-7) 来 计算 通过 
整个 工厂 的 最 快 路 径 。 但 这 样 的 一 个 递归 算法 存在 一 个 问题 : 其 运行 时 间 是 0(2")。 这 是 
因为 组 装 线 问 题 具 有 子 问题 重 和 至 性 , 即 低层 的 子 问题 将 多 次 被 计算 。 为 了 解决 这 一 点 , 设 
ri( 站 为 递归 算法 中 对 f[i, 站 的 访问 次 数 。 根 据 式 (8-1) ,有 : 


ri(n) =r:(n)=1 (8-8) 
根据 式 (8-6) 和 式 (8-7) ,对 j= 二 1,2,…,n 一 1, 有 
nD =n =n GAD HRG (8-9) 
下 面 说 明 对 j= 二 1,2,… nir G) —277 ,也 就 是 对 j 二 0,1,…,n 一 1， 
ri(n—j)=2 (8-10) 


为 此 ,对 j 做 数学 归纳 。 当 j==0 Wir OY j) =r 00 LR EX (8-8) n; G0 = 1 = 2 ,说明 
xXG-100) Xr, BEX 0j —n—1 3X G- 100A YE . Hl ri(n 一 门 二 2;。 考 虑 j 十 1 的 情形 。 
ri(n— Gr 10 rí-—-j—D 


=n(n—j) +re(n—j) (根据 式 (8-9)) 
二 2 十 2 (根据 归纳 假设 ) 
一 nu 
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这 样 就 证 明了 式 (8-10) 的 正确 性 ,于 是 FL1,1] 就 被 访问 了 277 wx. 

注意 ,对 7 人 2 ,每 一 个 值 f[i, 站 仅 依 赖 于 f[1,j 一 1] 和 f[2,j 一 1] 的 值 。 这 样 ,可 以 自 
底 向 上 地 计算 表 中 元 素 f[i, 站 的 值 ,这 样 做 比 递归 方 法 要 好 得 多 。 按 工序 号 j 的 递增 一 一 
图 8-3(b) 中 从 左 到 右 的 顺序 可 以 在 时 间 8(w) 内 计算 出 通过 全 厂 的 最 快 路 径 。 


FASTEST-WAY(a,t,e,zr,n) 
1 f[1,1]<e ta 

2 f[2,1]-—e a2 

3 for j<-2 to n 


4 do if /[1,j—1]ai; € f[2.j 71] tia; 
5 then /[1,]—/(1.j—1]—ai; 

6 L[1, 门 一 1 

7 else /[1,j]--/[2.j—1]9-t iai; 

8 [1,12 

9 it /[2,j—1] a); & f[1,j 1]H-t,-i a2; 
10 then /[2.j]7—/(2.j —1]--a:,; 

11 U2,j]<—2 

12 else /[2.j]-- /L1.j—1]4-5.-i +az.; 

13 1[2.j]—1 


14 if f[1n]9- m S fE2, n]: 
15 then f° =f[1.nJ+2, 


16 i= 
17 else f° = f[2.n] +22 
18 p=? 


算法 8-1 计算 最 快 路 径 组 装 时 间 的 FASTEST-WAY 过 程 


FASTEST-WAY 运行 如 下 。 

第 1 行 和 第 2 行 利用 式 (8-2) 和 式 (8-3) 计 算 /[1,1] 和 /[2,1]。 第 3 一 13 行 的 for 循 
HM i=1,2 K j=2,3, nH SLIM Lj]. 58 4—8 行 利用 式 (8-4) 计 算 /C1. TRI 
1[1,].5869—13 行 利用 式 (8-5) 计 算 f[2,j] 和 LL[2,j]。 最 后 ,第 14 一 18 行 利用 式 (8-1) 计 
算 广 和 上 。 由 于 第 1 行 和 第 2 行 及 第 14 一 18 行 消耗 常数 时 间 , 第 3 一 13 行 for 循环 的 
n— 1 次 重复 的 每 一 次 消耗 常数 时 间 ,整个 过 程 的 耗 时 为 O). 

观察 (Li. VEI 民 , 门 的 值 的 计算 过 程 , 方 法 之 一 是 我 们 在 表 中 填写 的 项 。 参 考 图 8-2(b) ,在 
含有 值 f[i, 门 及 LLi, 门 的 表 中 从 左 到 右 ( 每 一 列 的 数据 是 自 项 向 下 的 ) 填 写 。 为 填写 项 
fLi.j]. 8 39 f. f[1,j 一 1] 和 f[2,j 一 1], 而 这 两 项 已 经 计算 出 来 且 已 存储 ,只 要 查 表 
就 得 。 

4. 构造 通过 整个 工厂 的 最 快 路 径 


在 计算 了 jh fi ij JA U 这些 值 以 后 ,要 来 构造 通过 整个 工厂 的 最 快 路 径 中 所 
经 过 的 各 道 工 序 的 序列 。 利 用 记录 在 D 中 最 优 路 径 中 汽车 出 厂 前 所 做 的 最 后 一 道 工序 所 
在 的 组 装 线 编号 ,可 以 通过 查询 LZ ,nj] 和 追溯 到 最 快 路 径 中 前 一 道 工 序 所 在 组 装 线 编号 ,这 
是 因为 Lij ERT RRRA PI j 道 工序 的 前 一 道 工序 所 在 的 组 装 线 编号 。 以 这 样 的 方 
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式 , 可 以 写 出 下 列 递归 过 程 打 印 输出 一 个 最 优 解 。 


PRINT-STATIONSQ. i , j) 


lif j=1 
2 then print "line "i " ,station " j 
3 return 


4 PRINT-STATIONSC [Lij] j] jD 


5 print "line " i "station " j 
算法 8-2 打印 最 快 路 径 的 PRINT-STATIONS WE 


过 程 PRINT-STATIONS 从 最 顶层 调用 时 向 参数 i 传递 1”、 向 参数 j 传递 n 开始 ,每 次 递 
归 , 传 递 给 参数 j 的 值 都 要 减少 1, 故 递归 调用 "一 1 次 。 每 次 递归 运行 时 间 都 仅 消耗 常数 
时 间 , 所 以 过 程 PRINT-STATIONS 的 运行 时 间 为 6(n)。 对 图 8-3 中 的 例子 , PRINT- 
STATIONS 将 产生 如 下 输出 : 


line 1,station 1 
line 2, station 2 
line 1,station 3 
line 2,station 4 
line 2,station 5 


line 1,station 6 


8.1.3. 应 用 一 一 牛牛 玩 牌 


Cow Solitaire 


Description 

Late summer on the farm is a slow time.very slow. Betsy has little to do but play cow 
solitaire. For self-evident reasons. cow solitaire is not so challenging as any number of 
solitaire games played by humans. 

Cow solitaire is played using an NX N(3<N<7) grid of ordinary playing cards with 
four suits (Clubs, Diamonds, Hearts. and Spaces) of 13 cards (Ace, 2.3.4. 7.10. Jack. 
Queen. King). Cards are named with two characters: their value (A.2.3.4.*.9. T.J.Q. 
K) followed by their suit (C,D,H,S). Below is a typical grid when N=4: 

8S AD 3C AC (Eight of Spades. Ace of Diamonds. etc. ) 

8C 4H QD QS 

5D 9H KC 7H 

TC QC AS 2D 

To play this solitaire game. Betsy starts in the lower left corner ( TC) and proceeds 
using exactly 2 * N —2 moves of ‘right’ or ‘up’ to the upper right corner. Along the 
way she accumulates points for each card (Ace is worth 1 point.2 is worth 2 points,… ,9 


is worth 9 points. T is worth 10 points.J is 11.Q is 12.and K is 13) she traverses. Her 
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goal is to amass the highest score. 

If Betsy's path was TC-QC-AS-2C-7 H-QS-AC. her score would be 10 十 12 十 1 十 2 十 
7+12+1=45. Had she taken the left side then top ( TC-5D-8C-8S-AD-3C-AC) . her score 
would be 10+5+8+8+1+3+1=36,not as good as the other route. The best score for 
this grid is 69 points (TC-QC-9H-KC-QD-QS-AC 王 二 10 十 12 十 9 十 13 十 12 十 12 十 1). Betsy 
wants to know the best score she can achieve. One of the geek cows once told her 
something about "working from the end back to the beginning." but she didn't understand 
what they meant. 

Input 

Line 1: A single integer: N. 

Lines 2..N+1: Line i+1 lists the cards on row i (row 1 is the top row) using N 
space-separated card names arranged in the obvious order. 

Output 

Line 1: A single line with an integer that is the best possible score Betsy can achieve. 

Sample Input 

4 

8S AD 3C AC 

8C 4H QD QS 

5D 9H KC 7H 

TC QC AS 2D 


Sample Output 


69 
1, 问题 描述 与 分 析 


H NXN 张 扑 克 牌 排 成 一 个 方 阵 。 每 张 牌 的 点 数 形成 一 个 NXN 的 整数 网 格 A, 从 左下 
fa ALN,1] 漫 游 (每 一 步 只 能 向 上 或 向 右 行走 一 步 ) 到 右上 角 A[1, NJ], 要求 漫游 所 经 路 径 (每 
条 路 径 都 要 经 过 2N 一 1 个 格子 ) 上 各 个 格子 中 整数 之 和 最 大 。 这 是 一 个 组 合 优化 问题 。 从 网 
格 的 左下 角 ALN,]J] 漫 游 到 右上 角 AL1,N] 有 很 多 路 径 ,每 条 路 径 上 的 2N— 1 个 数 之 和 为 该 条 
路 径 的 目标 值 ,目的 是 找到 一 条 目标 值 最 大 的 路 径 的 目标 值 。 问 题 形式 化 描述 如 下 。 

输入 : NXN 整数 网 格 A[1..N,1..N]。 

输出 : A 中 从 左下 角 ALN,1] 到 右上 角 A[1,Nj 最 优 路 径 ( 目 标 值 最 大 ) 的 目标 值 。 

由 于 每 个 可 能 解 中 除 两 端 格子 固定 外 ,其 余 格 子 均 可 有 两 种 选择 : 向 上 或 向 右 。 所 以 , 解 
空间 含有 NS TCH. WRM N 很 大 时 ,对 解决 此 组 合 优化 问题 的 强力 算法 不 是 好 的 选择 。 

下 面 来 说 明 该 问题 具有 最 优 子 结构 。 假 定 路 径 p 是 从 A 的 左下 角 AL[N,1] 到 右上 角 
ALL. Nj 的 一 条 最 优 路 径 ,A[Li,j] 是 路 径 p 中 的 一 个 格子 。 则 p 中 从 ALN,1] 到 ALI 
部 分 pi HAM AEN 1151 A[i, 站 的 一 条 最 优 路 径 , 同 时 p 中 从 A[i,j] 到 A.N] 的 部 分 
pi 恰 为 从 A[i,j] B A.N] 的 一 条 最 优 路 径 。 这 是 因为 如 果 从 ALN,1] 到 A[i,jJ 有 一 条 
比 p, 更 优 的 路 径 pi. DU 省 与 p. 将 合并 成 一 条 从 ALN,1] 到 A[1,Nj 的 一 条 比 p 更 好 的 路 
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径 ,这 与 丸 是 最 优 的 路 径 假设 矛盾 。 同 理 可 知 对 ps 的 结论 。 按 此 性 质 , 若 设 f[i,j] 为 从 
AEN 115] A[i, 门 的 最 优 路 径 目 标 值 , 则 : 
4 (0 i 一 N 十 1 或 了 一 0 
开放 一 - Uli Lj flg-10]- AD] 0<i<N,0<j<N 
(8-11) 
我 们 要 求 的 是 /[1,N]。 从 图 8-4 中 就 可 知 问题 具有 重 秋子 问题 性 质 。 于 是 用 动态 规划 策 
略 设计 解决 此 问题 的 算法 。 
JUA 


S124 f13] 
SBA £123] £123] fn2] 


/ N ZN \ 
JAA £33) /B3) #122) /B3) 722) fRA fu 
图 8-4 Cow Solitaire 问题 的 重 倒 子 问题 性 质 


2. 算法 描述 


根据 问题 的 最 优 子 结构 及 子 问 题 重合 性 ,可 以 写 出 下 列 自 底 向 上 及 表 计 算 的 动态 规划 
算法 。 

COW-SOLITAIRE(A) 上 > 二 维 数组 A[1..N,1..N] 表 示 牌 点 网 格 

1 N-rows[A] 

2 for i--0 to N 十 1 

3 do f/[i,0]--0 

4 for j--1 to N 

5 do /[N--1,j]--0 

6 for iN downto 1 

7 do for j4-1 to N 

8 do q~max{ fli+1,j],fli,j—1]} 

9 flijl<qt+Ali.j] 

10 return fL1,N] 

算法 8-3 解决 Cow Solitaire 问题 的 COW-SOLITAIRE 过 程 


算法 COW-SOLITAIRE 运行 如 下 。 

第 2 行 和 第 3 行 及 第 4 行 和 第 5 行 的 for 循环 按 式 (8-11) 计 算 最 低层 子 问 题 最 优 解 的 值 
fli 0]G=1,2, NADE fENo-1.4]G0.1. N) 58 6—9 行 的 for 循环 按 式 (8-11)， 
自 底 向 上 地 逐 层 计算 f[i, 站 ]。 显 然 ,此 算法 的 时 间 复 杂 度 为 BCN2? ) 。 


3. 程序 实现 


1) 计算 最 优 解 
在 C 语言 中 实现 算法 8-3 是 很 直接 的 。 
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1 int cowSolitaire(int * a,int n){ 


2 int *í—Cint* )malloc((n+2) * Cn 十 1) * sizeof(int))， / * 为 数 表 f 分 配 空间 */ 
3 ijq: 
4 assert(D ; 
5  fori=0;i<=n+1;i++) 
6 flix Cn 十 1)] 一 0; / * {Lis0]<—0 * / 
7 for(j=1sj<nt+1;j++) 
8 f[(n+1) * Cn 十 1) 十 门 一 0; /* f[n+1,j]<-0 * / 
9 for(i=nsi>0si——) 
10 for(j 一 1;j 一 一 nj 十 十 ){ 
11 q—f[ GT D * Gc Dj]7 —f[i* (n 十 1) 十 j 一 1]? 
/ * q~max{fLit+1,j],fLi,j—1]) * / 
12 f{[G+)D * GT Dj]: 
13 ffi* Cn 十 1) 十 j 一 1]; 
14 fli» (n 十 1) 十 让 一 q 十 a[(i 一 1) * n 十 j 一 1]，  /* flisjlqtali.j] */ 
15 ) 
16 q=f[n+1+n]; / * 1,nJ 作 为 返回 值 * / 


17  free(D; 
18 return q; 


程序 8-1 实现 算法 8-3 的 C 函数 


对 程序 8-1 的 说 明 如 下 。 

(1) 函数 cowSolitaire 有 2 个 参数 ,表示 牌 点 (整数 ) 网 格 的 数组 a( 它 对 应 算法 8-3 的 过 
程 的 参数 A) 和 a 的 阶 数 n。 注 意 ,为 了 提高 程序 的 运行 效率 ,我 们 用 一 维 数组 , 按 行 优先 原 
则 存储 三 维 数组 的 数据 。 函 数 返回 从 网 格 a 的 左下 角 到 右上 角 最 佳 路 径 的 牌 点 总 和 ( 整 
%0. 

(2) 和 算法 过 程 一 样 , 函 数 内 定义 了 用 来 记录 各 层 子 问题 最 优 解 值 的 数 表 ff, 第 2 行将 其 
定义 为 整 型 指针 ,并 为 其 分 配 存 储 空间 。 注 意 ,算法 中 数 表 f 的 结构 是 一 个 (N 十 1) X (N 十 1) 
的 二 维 数组 f[1..N 十 1,0..N]。 为 使 程序 代码 更 接近 于 算法 伪 代 码 , 为 f 分 配 (n 十 2) X GE D 
的 空间 , 低 弃 的 下 标 为 0 的 那 一 行 。 此 外 ,局 部 变量 ij、dq 的 意义 与 算法 过 程 的 同名 变量 
是 一 致 的 。 

G) 第 5 行 和 第 6 行 与 第 7 行 和 第 8 行 的 for 循环 分 别 对 应 算法 中 第 2 行 和 第 3 行 及 
第 4 行 和 第 5 行 的 for 循环。 注意 , 按 行 优先 原则 存储 在 一 维 数组 中 的 二 维 数组 的 数据 元 
素 。 于 是 ,第 6 行 中 f[ix (n 十 1)J 表 示 的 是 {[i,0], 而 第 8 行 中 的 f[(n 十 1) * (Cn 十 1) 十 门 表 
示 的 是 f[n 十 1,j]。 第 9 一 15 TAA BRE for 循环 对 应 算法 中 第 6 一 9 (10 P8 MAMAS for 
循环 。 其 中 第 11 一 13 行 用 一 个 条 件 表 达 式 计算 max{f[i 十 1,j],f[i,j 一 1j}。 由 于 是 指向 
动态 数组 的 指针 ,为 防止 内 存 泄漏 ,函数 退出 前 ,第 17 行将 其 释放 掉 。 

2) 主 函 数 

调用 程序 8-1 中 的 函数 cowSolitaire, 解 决 Cow Solitaire 问题 的 主 函 数 代码 如 下 。 


1 int mainO( 
2 FILE * f1— fopen("chap04/Cow Solitaire/inputdata. txt" ,"r") , 
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* {2=fopen("chap04/Cow Solitaire/outputdata. txt" ,"w") ; 
char s(4]; 
int * aynyi,j; 
fscanfCf1, "6d" ,& m); 
a— (int * )malloc(n * n * sizeofCint)) ; 
for(i—0;icniic d) 
for(j=0;j<n;j++){ 
10 fscanfCf1, " Vs" s); 
11 a[i* nj] getValue(s[0]) ; 
12 ) 
13 fprintf(f2,"%d\n" ,cowSolitaire(a,n)) ; 
14  free(a); 
15  fcloseCf1? ; fclose(f2) ; 


16 return 0; 


€ 0 -3 Oo Oc & o 


程序 8-2 解决 Cow Solitaire 问题 的 C 程序 


程序 中 第 8 行 和 第 9 行 的 for 循环 从 输入 文件 1 中 读 取 牌 局 数据 ,填写 二 维 数组 a( 存 
储 在 一 维 数组 中 ) ,第 13 行 调用 函数 cowSolitaire 计算 对 牌 局 数据 a 计算 的 最 优 解 的 值 写 
入 输出 文件 {2 。 

第 10 行 从 输入 文件 中 读 取 牌 局 中 的 一 项 数据 s,s 是 一 个 含有 2 个 字符 的 字符 串 ,s[0] 表 
示 牌 点 数 ,s[1] 表 示 牌 的 花色 。 填 写 到 数组 a 的 是 sL0] 表 示 的 数据 ,而 它 表 示 的 是 2 一 9,A'， 
TQR FIT AR 11 行 调用 函数 getValue 将 这 样 的 字符 数据 转换 成 对 应 的 数值 数 
据 。 该 函数 的 实现 代码 如 下 。 

1 int getValue(char x) { /* 将 x 中 记录 的 牌 点 符号 转换 成 整数 值 * / 
2 if(x>=2'&&x<=9) 
3 return x—0'; 
4 if(x=='A) 
5 return 1; 
6 ifx==T) 
Kd return 10; 
8 if(x==]9) 
9 return 11; 
10 if(x=='Q) 
11 return 12; 
12 return 13; 


程序 8-3 ”将 字符 转换 为 整数 值 的 C 函数 


将 程序 8-1 一 程序 8-3 存在 文件 夹 chap08/Cow Solitaire 的 源 文件 Cow Solitaire. c 中 ， 
读者 可 打开 研读 ,并 试 运行 。 
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8.2 最 长 公共 子 序 列 


8.2.1 问题 描述 


在 很 多 应 用 中 需要 比较 两 个 序列 的 “相似 性 ”, 例 如 ,两 个 DNA 序列 的 比 对 。 人 们 常用 
公共 子 序列 的 长 度 来 描述 这 种 相似 性 。 

已 知 序列 的 子 序列 是 在 已 知 序列 中 去 掉 零 个 或 多 个 元 素 后 形成 的 序列 。 例 如 ， 
Z=<B,C,D,B># X—-—A,.B.C.B.D.A.B IW —^4 Y H3. 

给 定 两 个 序列 X BY. Z 同时 为 X 和 YY 的 子 序列 , 称 序列 Z 是 X 和 Y 的 一 个 公共 子 
序列 。X MY 的 公共 子 序 列 中 长 度 最 大 者 . 称 为 X 和 Y ep ai 
Longest Subsequence. LCS), 例如 ,车 X= 二 A,B,C,B,D,A,B> HY—-—B.D.C.A.B. 
A 二 ,序列 <B,C,A 二 是 X AY 的 一 个 公共 子 序列 。 然 而 , 它 不 是 X ALY 的 一 head 
是 因为 它 的 长 度 为 3, 而 长 度 为 4 MEN: C,B,A> 也 是 X Fl Y 的 一 个 公共 子 序列 。 

列 <B,C,B,A> 是 X 和 Y 的 一 个 Se IMS 长 度 为 5 
大 的 公共 子 序列 了 。 将 此 问题 形式 化 为 如 下 形式 。 

输入 : 序列 XSLT ox. 900 tm > A Y=<y oye ste syn > o 

输出 : X 与 Y 的 一 个 最 长 公共 子 序列 Z。 

这 是 一 个 组 合 优化 问题 。X Y 的 每 个 公共 子 序列 (可 行 解 ) 都 有 一 个 长 度 (目标 值 )， 
要 求 计算 最 长 公共 子 序列 (最 优 解 )。 如 果 用 强力 算法 来 解决 这 个 问题 , 则 需要 在 XY 的 所 
有 子 序列 中 找 出 公共 子 序列 ,然后 从 中 选择 长 度 最 大 的 。 这 需要 指数 级 的 时 间 来 完成 ,因为 
一 个 长 度 为 n 的 序列 ,有 2" 个 不 同 的 子 序列 。 


8.2.2 算法 设计 与 分 析 


1. 最 优 子 结构 与 子 问题 重 又 性 


为 了 考察 这 个 问题 能 否 用 动态 规划 的 方法 加 以 解决 ,需要 验证 该 问题 是 否 具有 最 优 子 
结构 和 子 问题 重合 的 特性 。 为 此 ,定义 序列 X 的 第 i BEBO X, <a aya > i= 
0,1,…,m。 例 如 ,车 X= 二 A,B,C,B,D,A,B 二 , 则 X, ——A.B.C. B>, Mi Xo 是 空 序列 。 
用 以 下 二 省 六 由 最 发 公共 子 序列 问题 具有 最 优 子 结构 特征 

定理 8-1( 最 长 公共 子 序列 的 最 优 子 结构 ) XSata DM YS <y. 
yy 二 为 两 个 序列 ,并 设 Z= <ar =, ,二 为 X 和 Y 的 任 一 LCS。 

COD Ë r,— y, M) zy = 2n = y, 且 Z 是 X。 HY, 的 一 个 LCS. 

(2) Ë xy, A Arm Wl Z JE X, 和 了 的 一 个 LCS。 

(3) 若 x, yu H Ayn W Z JE X 和 YY,-1 的 一 个 LCS。 

WEBB (1) #2Ax, WT en =y, 追加 到 Z 而 得 到 一 个 长 度 为 & 十 1 的 XX 和 YY 的 

公共 子 序列 ,这 与 Z 是 X MY 的 最 长 公共 子 序列 的 假设 矛盾 。 于 是 n5t, = yr DR, 
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Zi 是 X。 和 YY 的 一 个 长 度 为 & 一 1 的 公共 子 序列 。 我 们 希望 能 说 明 它 还 是 一 个 LCS。 
用 反 证 法 ,假定 X。-1 和 Y,-! 有 一 个 长 度 比 k 一 1 更 大 的 公共 子 序 列 。 将 zx, = y, 追加 到 
W 产生 出 X ALY 的 一 个 公共 子 序列 ,其 长 度 大 于 上 ,这样 就 蔬 盾 。 

D) FH Arm MZ E X, MY 的 一 个 公共 子 序列 。 dp Xn AY 的 一 个 公共 子 序列 
W 的 长 度 比 & 还 大 , 则 W EEX, AY 的 一 个 公共 子 序列 ,这 与 Z 是 X MY h LCS F. 

(3) 的 证 明和 (2) 的 证 明 是 对 称 的 。 

定理 8-1 说 明 两 个 序列 的 LCS 包含 了 这 两 个 序列 的 前 级 的 LCS。 于 是 LCS 问题 具有 
最 优 子 结构 特性 。 根 据 此 定理 , 若 zw 一 ,必须 寻求 Xn 和 了 :的 一 个 LCS。 把 zw 一 yn 
追加 到 此 LCS 的 尾部 就 得 到 X ALY 的 一 个 LCS。 若 zx, 去 y,, 则 必须 解 两 个 子 问题 : 寻求 
Xn Hl Y 的 一 个 LCS R X 和 Yi: 的 一 个 LCS, 两 者 中 的 较 长 者 就 是 X A Y 的 一 个 LCS, 
由 于 这 些 情况 穷尽 了 所 有 的 可 能 ,我 们 知道 这 些 子 问题 最 优 解 之 一 必 包 含 在 X 和 YY 的 一 个 
LCS 中。 

设 c[i, 门 为 子 序列 X; ALY; 的 LCS 的 长 度 。 若 i 二 0 或 j 二 0, 这 两 个 子 序列 中 至 少 有 
一 个 的 长 度 为 0, 所 以 LCS 的 长 度 为 0。 最 长 公共 子 序列 问题 的 最 优 子 结构 给 出 下 列 递 
EX: 


0 i 二 0 或 j=0 
tn- fe-nn inj >0H 2, =5, (8-12) 
max {cli,j—l],cli—1,j]} ij >0H zy, 

在 式 (8-12) 中 不 难看 到 重 倒 子 问题 特性 : 为 寻求 X 和 YY 的 最 长 公共 子 序列 ,要 寻求 X 
AY, AK Xn AVY 的 最 长 公共 子 序 列 。 而 这 些 子 问 题 有 着 寻求 Xn A Y, gd A 
共 子 序列 子 子 问题 。 很 多 其 他 子 问题 共享 子 子 问题 ,如 图 8-5 所 示 。 于 是 ,利用 动态 规划 策 
略 , 自 底 向 上 地 计算 c[i, 门 ,直至 算出 cLm,nj]。 注 意 ,在 此 定义 中 ,二 维 表 c 的 行 标 和 列 标 
都 是 从 0 开始 编号 的 。 


«21 
Pel B 
xs 


(0,0) c[1,0] e[0,1] [0,1] c[0.2] e[1.1] [1,0] cf1.1) c[2.0] 


图 8-5 LCS fa) ASF [o] JB SCR E 


2. 计算 LCS 长 度 


LcS-LENGTH (X,Y) 
1 m--length[ X] 

2 n--length[Y] 

3 for i<-1 tom 

4 do c[i,0]<0 
5 for j<-0 ton 
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6 do c[0.j]--0 
7 for i<-1 to m 
8 do for j<-1 ton 


9 do if z, — y; 

10 then cLi.j]<cli—1,j—1]+1 
11 else if c[i—1,j]>c[i,j—1] 

12 then cli, j]<clLi—1,j] 
13 else cLisj]<cli,j—1] 
15 return c 


算法 8-4 计算 两 个 序列 的 最 长 公共 子 序列 的 Lcs-LENGTH 算法 
算法 过 程 中 第 3 行 和 第 4 行 的 for 循环 及 第 5 行 和 第 6 行 的 for 循环 按 式 (8-12) 计 算 


最 底层 的 子 问题 最 优 解 的 值 。 第 7 一 13 行 的 两 重 嵌 套 for 循环 按 式 (8-12) 自 底 向 上 地 计算 
各 层 子 问题 最 优 解 的 值 。 例 如 ,对 X=<A,B,C.B,D,A,B>#l Y=<B,D,C,A,B,A> 
算法 产生 的 表 c 如 下 。 
j 0 1 2 3 4 5 6 
i yj B D [o] A B A 
0 rj 0 0 0 0 0 0 0 
1 A 0 0 0 0 1 1 1 
2 B 0 p 1 1 1j 2 2 
3 C 0 i 1 2 2 2 2 
4 B 0 1 1 2 2 3 3 
5 D 0 1 2 2 2 3 3 
6 A 0 1 2 2 3 3 4 
7 B 0 1 2 2 3 4 4 
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3. 构造 一 个 最 优 解 
可 以 用 如 下 过 程 来 根据 过 程 LCS-LENGTH 计算 出 来 的 表格 c 构造 出 最 优 解 。 


PRINT-LCSCc,X,Yi7) 
1 if i=0 or j=0 


2 then return 

3 if z; — yj 

4 then PRINT-LCS (c. X.Y .i—1.j—1) 

5 print z; 

6 elseif cli—1,j ]cli,j—1] 

7 then PRINT-LCS (c,X,Y,i—1,)) 
8 else PRINT-LCS (c, XY, i,j—1) 


算法 8-5 ”打印 最 长 公共 子 序列 的 算法 


第 8 章 动态 规划 策略 


4. 算法 的 运行 时 间 


过 程 LCS-LENGTH 的 主体 是 第 7 一 16 行 的 两 重 说 套 的 for 循环 ,容易 看 出 其 时 间 复 杂 
BEA TGn 20 — 960) HEP m i DAA X ALY 的 长 度 。 过 程 PRINT-LCS 的 时 间 复 杂 度 为 
TO .2)—06Gn T2). 


8.2.3 程序 实现 

我 们 的 目标 是 开发 一 个 能 用 来 计算 任何 类 型 的 两 个 序列 的 最 长 公共 子 序列 的 函数 。 为 
此 ,对 算法 8-4 和 算法 8-5 分 别 加 以 讨论 。 

1. 计算 LCS 的 长 度 


如 上 所 述 ,我 们 的 目标 是 开发 一 个 能 计算 两 个 任意 类 型 的 序列 x、y 的 最 长 公共 子 序列 
的 通用 函数 。 如 在 前 两 章 中 看 到 的 ,C 语言 中 数据 抽象 的 有 力 工具 就 是 void * 指针 和 函数 
指针 。 


l int» lcsLength(void * x,void * y,int size,int m,int n,int( * comp)(void * ,void * )){ 


2 int i,j; 

3 int * c= Cint * )malloc((m+1) * (n+1) * sizeofCinD) ; 

4 for(i—1l;ic-—m;icd) 

5 c[i* Cn 十 1)] 一 0; / * ci,0]«-0* / 

6 for(j—0;j —n;jt- -) 

7 ci)-0; /*c[0,j]—-0* / 

8 for(i—-l;ic-—m;icd) 

9 for(j=1;j<=n;j++) 

10 if(comp(x+ G— 1) * sizeyy 十 (j 一 1) * size) ==0) /* if x[i]— y[j]1* / 

11 cLix (n 十 1) 十 门 一 c[(Gi 一 1D) * (nt+D+j—1]+1l; /*dijledi-lj—1]-1*/ 
12 else if(c[ (i D * (n+1)+jJ>=cL[i* (n 十 1) 十 j 一 1]) 

13 c[i* (n- D tj]-d G- D * (n+) +j]; /* ci j]--c[i-1,)] * / 
14 else 

15 c[i* (n- Dt j]-di* (Cn 十 1) 十 j 一 1]; / * ci j]-7c[i.j—1] * / 
16  returnc; 

17) 


程序 8-4 实现 算法 8-4 的 C 函数 


对 程序 8-4 的 说 明 如 下 。 

(1) 函数 lcsLength 除了 序列 x 和 y 以 外 ,还 多 出 了 size m, n 和 comp 4 个 参数 。 其 
中 ,m 和 nm 分别 是 x 和 y 所 含 的 元 素 个 数 。size 是 存储 在 x, y 中 的 元 素 的 真实 长 度 。 
comp 是 检测 x、y 中 元 素 是 否 相 等 的 比较 规则 。 该 函数 返回 计算 所 得 的 矩阵 c( 用 一 维 数 
组 表示 )。 

(2) 用 一 维 数组 来 表示 矩阵。 第 3 行将 数组 c 定义 成 能 表示 (n 十 1) X (n+1) 和 矩阵 。 注 
意 ,在 此 算法 的 实现 中 ,数组 c 的 下 标 编号 与 伪 代 码 中 是 一 致 的 ,从 0 开始 。 
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(3) 第 4 一 16 行 实现 的 是 算法 LCS-LENGTH 的 第 3 一 15 行 的 操作 ,代码 几乎 是 一 一 对 
应 的 。 要 注意 的 是 用 一 维 数组 表示 和 矩阵 时 ,和 矩阵 元 素 的 行 标 、 列 标 与 数组 下 标的 对 应 关系 
( 见 各 行 注 释 信 息 ), 以 及 第 10 行 调用 comp 检测 x[ 训 、y[Dj] 是 否 相 等 。 


2. 构造 一 个 最 优 解 
算法 8-5 的 实现 如 下 。 


1 void printLcs(int * c,int n,void * x,void * y'int size,int i,int j, 


2 int( * comp) (void * ,void * ),void( * prt) (void * )){ 

3 ifGG==0 || j==0) 

4 return; 

5 if(comp(x+ (i—1) * size,y+(j—1) * size) = =0) { / *if xi] yL] * / 
6 printLes(c,n,x+y+sizesi—1,j—1,comp, prt); 

7 prtCxt- G— D * size); / * print x[i] * / 
8 — Jeleif(c[G— D * (n-- Dj] —d[i* Cn 十 1D) 十 j 一 1]) 

9 printLcsCcs n. x» yssizesi— l,j» comp» prt); 

10 else 

11 printLcs(cynyxyyvsize,i,j 一 1,comp,prt); 

12) 


程序 8-5 实现 算法 8-5 的 C 函数 


出 于 函数 通用 性 的 考虑 ,该 函数 除了 对 应 于 算法 的 表示 矩阵 c, 两 个 序列 x、y, 以 及 两 个 
下 标的 i,j 的 参数 以 外 ,还 带 有 反映 矩阵 < 的 列 数 n, 表 示 序 列 中 元 素 存储 长 度 的 size, 序 列 
元 素 比较 规则 的 comp 和 打印 序列 元 素 的 操作 prt。 

代码 几乎 是 一 一 对 应 的 。 注 意 ,第 5 行 调用 comp 检测 xil. yG Je 8 4 9.55 7 行 调 用 
prt 打印 x[i]. 

为 便于 重用 ,将 程序 8-4 和 程序 8-5 定义 的 函数 写 在 文件 夹 dprog 中 的 源 文件 lcs.c 中 ， 
而 将 这 两 个 函数 的 原型 声明 写 在 同一 文件 夹 内 的 头 文件 lcs.h 中。 


8.2.4 应 用 


1. SY ARE SR HE 
Hero Shoot Eagle 


Description 

Once a hero named Guo Jing invented a new style of cross-bow that could shoot 
consecutively. The arrow could hit the eagle exactly if only the arrow could reach the 
height of the eagle. However.there was a flaw of the corss-bow: only the first arrow could 
reach any height and the height that the arrow shot latter could reach was always lower 
than the former one. Actually.the higher the cross-bow can hit.the better the performance 


itis. One day.Guo Jing happened to see a crowd of eagles flying through the sky. Now 
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you have to work out a program that helps Guo Jing to count how many eagles he can 
shoot down at most. 

Input 

This problem contains multiple test cases. For each test case. input the number of 
eagles n (1<n<1000) in the first line. then input the height h (1<h<10000) of each 
eagle in another new line with a blank between every two of them. 

Output 

Please calculate the maximal number of eagles m that can be shot down by the cross- 
bow in the first line.and then output the height of the each eagle that have been shot down 
and separated by blanks in the second line. 


Sample Input 


8 

389 207 155 300 299 170 158 65 
2 

100 105 


Sample Output 


6 

389 300 299 170 158 65 
1 

105 


1) 问题 描述 与 分 析 

郭靖 发 明了 一 种 连 发 的 马 稍 。 每 支 箭 的 射出 高 度 可 以 事先 确定 ,但 都 不 会 超过 它 的 前 
面 那 支 箭 的 射出 高 度 。 对 飞 过 的 鹰 群 (每 只 应 的 飞翔 高 度 已 知 ) ,最 多 能 用 此 马 箭 射 下 多 少 
只 应 ? 本 问题 实质 上 是 下 列 最 长 有 序 子 序列 问题 。 设 A= <a rasa > FE n TARTAN SEM 
的 序列 ,L 的 有 序 子 序列 是 这 样 一 个 子 序列 A — <an ,ae saim DIEP ki <ko mh, 
H an Kan raus (或 an 宇 aw 宇 … 三 am)。 而 最 长 有 序 子 序列 问题 是 求 最 大 的 mm 值 。 
本 问题 实际 上 是 计算 序列 的 最 长 下 降 子 序列 。 

输入 : 序列 A=<a, ,az ,… sa, > 

输出 : A 的 下 降 子 序 列 A“ 王 天 aa ,ae aus > IEP ds e Rn H. an > 
an> Sam 中 的 最 长 者 。 

要 解决 这 个 问题 ,构造 一 个 新 的 序列 B. 它 是 对 A 进行 降序 排序 而 得 ,可 将 此 问题 转换 
MR ALB 的 最 长 公共 子 序列 。 利 用 LCS-LENGTH 和 PRINT-LCS 过 程 就 可 得 到 本 问题 
的 解 。 

2) 算法 描述 


HERO-SHOOT-EAGLE(A) 

1 n<legth[A] 

2 copy A to B 

3 SORT(B) b xt BB 做 降序 排序 
4 c<Lcs-LENGTH(A,B) 
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5 print c[n,n] as a line 
6 PRINT-LCS (c,A,n,n) 


算法 8-6 解决 Hero Shoot Eagle 问题 的 伪 代 码 过 程 


3) 程序 实现 
利用 程序 8-2 和 程序 8-3 ,很 容易 将 算法 8-6 实现 为 以 下 程序 。 


1 int heroShootEagle(int * a,int n){ 


€ 0 -3 o oc £o t 


10 
11} 
12 int 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 } 


int * b= (int * )malloc(n * sizeof(int)) , * c,x; 
assert(b) ; 

memepy(b,a,n * sizeofCint)) ; 

quickSort(b sizeofCint) ,0,n— 1 , intLess) ; 

c— lesLength(b,a,sizeof( n) ,n,n,intLess) ; 
x=c[n* (nt+1)+n]; 
printLes(c,n,b,a,sizeof(int) ,n,n,intLess, putInt) ; 
free(b) ;freeCc) ; 


return x; 


mainO ( 
FILE * f1— fopen("chap08/Hero Shoot Eagle/inputdata. txt" ,"r") , 


* {2=fopen("chap08/Hero Shoot Eagle/outputdata. txt" ,"w") ; 


int n, * asi; 


initStrOutputStream( &ssout, 500) ; /x 初 始 化 全 局 串 输出 流 ssout * / 
while( !feofCf1)) ( 
fscanf(f1,"%d",&n); /* 读 人 案例 所 含 元 素数 目 * / 
a= (int * )malloc(n * sizeof(int) ) ; 
for(i=0;i<nsit +) /* 读 入 案例 的 n 个 数据 * / 
fscanfCf1, "6d" ,a+i); 
ÍprintfCf2, " % d\n" , heroShootEagle(a,n) ; / * 处 理 数据 ,并 输出 最 长 度 * / 
free(a); 
fputs(ssout. begin, {2) ; /* 输出 最 长 降序 子 序列 / 
Íputc(An' £25 ; 
sosRewind( S.ssout) ; / * 串 输出 流 复 位 * / 
fclose(fl) ifcloseCf2) ; 
return 0; 


程序 8-6 ”解决 Hero Shoot Eagle 问题 的 C 程序 


对 程序 8-6 的 说 明 如 下 。 

CD 第 1 一 11 行 定义 的 函数 heroShootEagle 实现 算法 8-6。 与 算法 相 比 ,该 函数 除了 数 
组 参数 a 以 外 ,还 有 一 个 表示 数组 a 的 元 素 个 数 的 参数 n。 函 数 需要 向 外 界 返 回 a 中 最 长 降 
序 子 序列 的 长 度 。 

(2) 在 heroShootEagle 的 函数 体 中 ,为 数组 b 分配 了 存储 空间 后 (第 2 行 ), 调 用 库 函 数 
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memcpy 将 数组 a 复制 给 数组 b( 第 4 行 )。 第 5 行 调用 在 第 3 章 3. 2. 2 节 定 义 的 函数 
quickSort 对 b 进行 降序 排序 。 第 6 行 调用 本 节 中 定义 的 函数 IesLength 计算 b 与 a 的 最 长 
公共 子 序列 长 度 , 返 回 得 到 数 表 c。 第 7 行将 b 和 a 的 最 长 公共 子 序列 的 长 度 cLn,n] 和 暂 存 
于 x。 第 8 行 调用 本 节 定 义 的 函数 printLes, 将 b 和 a 的 最 长 公共 子 序 列 输出 到 第 2 章 中 
2.1.4 节 定 义 的 全 局 串 输出 流 ssout 中 (注意 ,传递 给 printLes 的 最 后 一 个 参数 是 在 第 2 章 
中 2.1.4 节 定义 的 函数 putInt, 该 函数 将 传递 给 它 的 整 型 数据 写 和 人 ssout)。 最 后 ,第 10 fT 
将 存 于 x 中 的 b 与 a 的 最 长 公共 子 序列 长 度 作为 函数 值 返回 。 

(3) 函数 heroShootEagle 与 算法 过 程 HERO-SHOOT-EAGLE 有 一 些微 妙 的 差别 。 算 法 
过 程 将 直接 向 输出 文件 输出 最 长 降序 子 序列 长 度 和 最 长 降序 子 序 列 。 而 函数 却 是 将 最 长 降 
序 子 序列 长 度 作 为 函数 值 返回 ,而 将 最 长 降序 子 序 列 写 入 到 串 输 出 流 ssout。 这 样 做 主要 是 
因为 考虑 重用 lcsLength 和 printLcs。 因 为 printLes 可 以 通过 函数 指针 参数 proc 来 灵活 地 
处 理 各 种 类 型 的 序列 元 素 。 我 们 的 目标 是 将 序列 的 元 素 写 到 指定 的 文件 中 去 ,但 proc BUR. 
有 一 个 指向 元 素数 据 的 指针 作为 参数 ,无 法 得 到 目标 文件 的 信息 。 解 决 方法 无 非 是 定义 新 
的 向 全 局 文件 写 和 人 整 型 数据 的 函数 或 者 利用 已 经 定义 好 的 全 局 串 输出 流 ssout 和 向 ssout 
写 人 整 型 数据 函数 putInt。 在 此 ,选择 后 者 ,这 既 可 以 节省 版 面 , 又 体现 了 代码 重用 的 软件 
工程 思想 。 这 种 做 法 ,使 得 将 向 输出 文件 写 和 数据 的 操作 移 到 了 函数 heroShootEagle 之 外 
的 main 函数 中 完成 。 第 22 行 ,调用 fprintf 函数 将 heroShootEagle 返回 值 表示 的 最 长 降序 
子 序列 长 度 写 入 文件 f2, 第 26 行 调用 函数 [puts 将 记录 在 ssout 中 的 最 长 降序 子 序列 写 入 
文件 f2。 

程序 8-6 存储 在 文件 夹 chap08/Hero Shoot Eagle 中 的 源 文件 HeroShootEagle. c 中 。 


2. 基因 函数 
Human Gene Functions 


Description 

It is well known that a human gene can be considered as a sequence, consisting of four 
nucleotides. which are simply denoted by four letters. A.C.G.and T. Biologists have been 
interested in identifying human genes and determining their functions. because these can be 
used to diagnose human diseases and to design new drugs for them. 

A human gene can be identified through a series of time-consuming biological 
experiments.often with the help of computer programs. Once a sequence of a gene is 
obtained, the next job is to determine its function. 

One of the methods for biologists to use in determining the function of a new gene 
sequence that they have just identified is to search a database with the new gene as a 
query. The database to be searched stores many gene sequences and their functions and 
many researchers have been submitting their genes and functions to the database and the 
database is freely accessible through the Internet. 

A database search will return a list of gene sequences from the database that are 


similar to the query gene. 
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Biologists assume that sequence similarity often implies functional similarity. So.the 
function of the new gene might be one of the functions that the genes from the list have. 
To exactly determine which one is the right one another series of biological experiments 
will be needed. 

Your job is to make a program that compares two genes and determines their 
similarity as explained below. Your program may be used as a part of the database search 
if you can provide an efficient one. 

Given two genes AGTGATG and GTTAG.how similar are they? One of the methods 
to measure the similarity of two genes is called alignment. In an alignment. spaces are 
inserted.if necessary.in appropriate positions of the genes to make them equally long and 
score the resulting genes according to a scoring matrix. 

For example. one space is inserted into AGTGATG to result in AGTGAT-G. and 
three spaces are inserted into GTTAG to result in -GT—TAG. A space is denoted by a 
minus sign C. The two genes are now of equal length. These two strings are aligned; 
AGTGAT-G 
- GT-TAG 

In this alignment. there are four matches. namely.G in the second position, T in the 
third. T in the sixth. and G in the eighth. Each pair of aligned characters is assigned a 
score according to the following scoring matrix. 


A C G T — 


A 5 eulos A ss eS 
C =f 5 3), |;=] =4 
G a |. 27:9. 5 a Se 
T zz d | ee 5 zb 


—|-23|-4|-2|]-1| >» 


The * denotes that a space-space match is not allowed. The score of the alignment above 
is〈 一 3) 十 5 十 5 十 (一 2) 十 (一 3) 十 5 十 (一 3) 十 5 一 9. 


Of course. many other alignments are possible. One is shown below (a different 


number of spaces are inserted into different positions) : 
AGTGATG 
-GTT A-G 
This alignment gives a score of (一 3) 十 5 十 5 十 (一 2) 十 5 十 (一 1) +5=14. So.this one is 
better than the previous one. As a matter of fact. this one is optimal since no other 
alignment can have a higher score. So.it is said that the similarity of the two genes is 14. 
Input 
The input consists of T test cases. The number of test cases T is given in the first line 
of the input file. Each test case consists of two lines: each line contains an integer, the 


length of a gene.followed by a gene sequence. The length of each gene sequence is at least 
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one and does not exceed 100. 
Output 
The output should print the similarity of each test case,one per line. 
Sample Input 
2 
7 AGTGATG 
5 GTTAG 
7 AGCTATT 
9 AGCTTTAAA 


Sample Output 


14 
21 


D 问题 的 描述 与 分 析 

人 类 基因 是 由 A.C.G.T 4 种 核 苷 构成 的 序列 。 在 生物 学 研究 中 ,常常 需要 比较 两 个 基因 
序列 的 相似 程度 。 本 问题 对 两 个 基因 序列 给 出 一 种 相似 程度 的 度量 方法 一 一 联 配 计 分 。 具 体 
方法 是 ,在 序列 中 必要 的 位 置 上 添加 空格 (用 “一 ”表示 ) ,使 得 两 个 序列 长 度 一 致 ,然后 按 给 定 
的 计 分 矩阵 计算 出 序列 的 相似 度 。 目 标 是 找 出 相似 度 最 大 的 联 配 。 问 题 可 形式 化 为 如 下 。 

输入 : 两 个 由 {A,C,G,T} 中 的 符号 构成 的 序列 X Y DIEA RE A。 

输出 : 计算 出 序列 X LY 的 最 大 联 配 相似 度 。 

其 中 , 计 分 矩阵 A 由 下 表 给 出 : 


A 5 | mE ae 
C =i 5 728—525 :—4 
G za. 8: 5 = 2. 
T = | 5 =] 


— |-3]-4]—-2}]-1] >» 


其 实 ,DNA 序列 的 LCS 问题 可 视 为 上 述 问题 中 计 分 矩阵 为 单位 阵 时 的 一 个 特例 。 所 
以 , 设 s, 门 为 XY finiti X, Y; 的 最 大 联 配 相似 度 。 则 不 难 理解 下 列 递归 式 : 


0 i=0 且 j=0 
= s[i—1,0]+A[z:;,—] i>0 且 j=0 
SMS oA i=0 且 j>0 


maxis[i—1,j — 1] - AL; y; ]sLi — 1,5] Az; 一 ],s[iyj 一 1 十 A[ 一 ,y;]} 其 他 
利用 此 递归 式 , 可 以 设计 一 个 类 似 于 LCS-LENGTH 的 算法 。 
2) 算法 描述 与 分 析 


HUMAN-GENE-FUNCTIONS(X,Y ,A) 
1 m-lengthL X] 
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2 n<lengthLY ] 

3 s[0,0]--0 

4 for i<-1 to m 

5 do s[i,0]«-s[i—1,0] +ALz; ,一 ] 
6 for j<-0 ton 

7 do sl0,j]<s(0,j—1]+A[—,y;] 
8 for i<-1 to m 

9 do for j<-1 ton 


10 do s[i.j ]-7max(sLi—1.j—1]9- AUx; y; ]* 
11 sLi-1,j]-AUz; ,一 ]， 
12 sli,j—1]+AL—.y,]} 


14 return s[m,n] 
算法 8-7 计算 两 个 DNA 序列 最 大 联 配 相似 度 的 算法 过 程 
算法 8-7 的 运行 时 间 主 要 消耗 在 第 8 一 12 FW ERE for 循环 上 。 很 容易 看 出 ,第 


10—12 行 的 循环 体 共 重复 mn 次 。 所 以 ,算法 过 程 HUMAN-GENE-FUNCTIONS 的 时 间 复 杂 


FE OGmn). 
3) 程序 实现 
由 于 计 分 矩阵 是 固定 的 ,为 了 简化 函数 参数 ,将 其 定义 为 如 下 的 全 局 二 维 数组 。 
int a[5][5] 一 {5, 一 1, 一 2, 一 1, 一 3， / * 计 分 矩阵 * / 


—1,5,—8,—2,—4, 
—2,—9,5,—2,—2, 
—1,—2,—2,5,—1; 
—3,—4,—2,—1.0]); 


注意 : 表示 空格 与 空格 比 对 的 aL4][4] 的 数据 在 算法 中 是 不 会 用 到 的 ,所 以 可 取 任 意 


值 ,此 处 取 0。 


下 面 两 个 辅助 函数 max3 及 index 是 在 实现 算法 8-7 时 分 别 用 来 计算 3 个 整数 项 


SLC 一 1 一 二 十 ALzy],sC 一 1, 门 十 A[z ,一 ] 和 si 一 可 十 A[ 一 ,y] 最 大 值 及 将 字符 


A、C 
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`G、T 映射 到 计 分 矩阵 下 标的 。 


1 int max3(int a,int bint c){ /* 计 算 3 个 整数 的 最 大 值 * / 
2 int d=a>=b? a:b; 
3 return d>=c? d:c; 


4) 

5 int index(char A) { /* 将 字符 A.C、G、T 转换 为 下 标 0、1、2、3*/ 
6 switch( A) ( 

7 case 'A'; return 0; 

8 case C'; return 1; 

9 case G'; return 2; 

10 case 'T'; return 3; 

ll } 

12) 


程序 8-7 用 来 计算 3 个 整数 最 大 值 及 转换 数组 下 标的 C 函数 
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下 列 函 数 humanGeneFunctions 实现 算法 8-7。 


1 int humanGeneFunctions(char * x,char * y){ / * 联 配 计 分 * / 
2 int * s,i,jum.n.r; 

3 m=strlen(x) ;n= strlen(y); 

4 assert(s= (int * )malloc((m+1) * (n+1) * sizeofCinD)) ; 

5 s[0]—0; 

6 for(i-l;ic-—m;it-d) 

7 sli* (n 十 1)] 一 s[(i 一 1) * (n 十 1)] 十 a[index(x[i 一 1])][4]， 
8 for(j—1;jc —n;jjt 4) 

9 s(jJ=slj—1]+al4][index(y[j—1])]; 

10 for(i—-l;ic-—mi;idT-c) 


1 for(j-1;j —nij 4) 

12 s[i* (n 十 1) 十 门 于 max3(s[(i 一 1) * (n+) j—1]-a[indexG[i— 1) J[index(yj—1])], 
13 s[(i 一 1) * (n+1)+j]+alindex(xfi—1) ][4], 

14 sLi* G4 D j—1]-a[4]LindexCy[j 71D D : 


15 r—s[m* (n Dn]; 
16  free(s); 
17 return r; 


程序 8-8 ”实现 算法 8-7 的 C 函数 


对 程序 8-8 的 说 明 如 下 。 

CD 由 于 将 计 分 矩阵 定义 成 全 局 量 ,所 以 函数 humanGeneFunctions 比 伪 代 码 过 程 
HUMAN-GENE-FUNCTIONS 少 一 个 参数 , 仅 保留 表示 两 个 DNA 序列 的 串 x 和 y. 

(2) 函数 体内 定义 了 与 算法 过 程 中 同名 的 变量 m、n、s\i\j 等 。 虽然 s 应 该 是 一 个 用 来 
表示 (m 十 1) X (n 十 1) 数 表 的 二 维 数组 ,但 出 于 程序 运行 效率 的 考虑 仍然 将 其 定义 成 一 个 动 
态 的 一 维 数组 (第 4 行 ) ,并 按 行 优先 原则 存储 二 维 数组 的 数据 。 

(3) 程序 的 代码 结构 与 算法 过 程 的 伪 代 码 结构 十 分 相似 。 要 注意 的 是 伪 代 码 中 计 分 矩 
阵 中 元 素 的 下 标 是 用 对 应 的 字符 A CGT 及 空格 “一 ”表示 的 ,这 在 C 代码 中 是 不 行 的 。 
所 以 ,需要 调用 在 程序 8-7 中 定义 的 函数 index 来 将 A\C.G、T 分 别 转换 为 0.1.2、3 而 将 空 
格 ( 表 为 一 ) 直 接 对 应 4。 

利用 这 些 函 数 定义 ,解决 Human Gene Functions 问题 的 主 函 数 设 计 如 下 。 


1 int main(){ 

FILE * f1—fopen("chap08/Human Gene Functions/inputdata. txt" ,"r") , 
* [2— fopen(" chap08/ Human Gene Functions/outputdata. txt" ,"w"); 

char x[101]. y[ 101]; 

int t,i,a; 

assert({1& &f2) ; 

fscan{(fl,"%d",&-t); 

for(i=0;i<tsit++){ 
fscanf{(fl,"%d%s".&-a,x); 

10 fscanf(f1,"%d%s",&-asy)s 


Coron & wn 
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11 ÍprintfCf2, " % d\n" ,humanGeneFunctions( x» y) ) ; 
12 ) 

13 felose({1) ,fclose(f2); 

14 return 0; 

15 } 


程序 8-9 解决 Human Gene Functions 问题 的 C 程序 
程序 中 第 7 行 从 输入 文件 生 中 读 取 案例 数 t。 第 8 一 12 行 的 for 循环 处 理 每 一 个 案例 。 
其 中 ,第 9 行 和 第 10 行 从 {1 中 读 取 案例 中 的 两 个 DNA HB x Bl y; 第 11 行 调用 程序 8-8 计 
算 这 两 个 串 的 最 优 联 配 度 并 写 入 输出 文件 f2 中 。 程 序 8-7 一 程序 8-9 存储 在 文件 夹 
chap08/Human Gene Functions 的 源 文 件 Human Gene Functions. c 中 。 


8.3 0-1 背包 问题 


8.3.1 问题 描述 


将 第 7 39 7.1.1 节 讨论 过 的 0-1 背包 问题 重新 描述 如 下 。 设 及 种 物品 ,第 i 种 物品 
的 质量 为 wi ,价值 为 vi ,i 二 1,2,…,n。 给 定 一 个 背包 ,最 多 能 装 质量 为 C 的 物品 。 第 i 种 物 
品 或 放 入 包 中 ,或 留 在 包 外 。 问 将 哪些 物品 放 到 包 内 能 使 得 包 中 所 装 物 品 总 价值 最 大 ? 其 
中 ,wi、v; 都 是 正 整 数 ,i 二 1,2,…,n。C 也 是 正 整 数 。 如 果 用 一 个 向 量 oe = Cn ersten) 


-- L1 
来 表示 此 问题 的 解 ,其 中 心 一 人 二 号 物品 放 入 包 中 , 则 0_1 背包 问题 可 形式 化 地 描述 为 


0 i 号 物品 未 放 入 包 中 

如 下 。 

输入 : HEA WH (wr swe sw} V= 0n v mou) ,数值 C。 

输出 : 向 量 z= (ay arse n € (0.1) 1 <i < n, (44 Yaw, <C, A Ia, 
最 大 。 

这 是 一 个 典型 的 组 合 优化 问题 。 所 有 27 AS I fib ae = Gri ears m0 m € (041) 1i 
,构成 问题 的 解 空间 。 可 行 解 受 》 rue, < C 限制 且 以 >) co 为 目标 值 。 目 的 是 求 出 可 
行 解 中 的 最 优 解 一 一 目标 值 最 大 者 。 若 用 回溯 算法 ,将 耗费 指数 级 的 时 间 。 


8.3.2 算法 设计 与 分 析 


1. 最 优 子 结构 与 子 问题 的 重生 


下 面 来 考察 此 问题 是 否 具 有 最 优 子 结构 和 子 问 题 重 琶 性 质 。 

定理 8-2(0-1 背包 问题 的 最 优 子 结构 ) 设 y 一 (yy yi) W — Gi we wid. 
V— (uy vs ete) BOY j AY 0-1 背包 问题 的 一 个 最 优 解 。 

D Ë wi 27 j MI y = rsy ym) W — (Cw we mw Vm (mme 
viai) ,数值 为 j 的 子 问题 的 最 优 解 。 
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D Ë wj A y; 0l] y = On ys 09 W — Cw ws mad V— (ime 
Ue ett eoa ) 数值 为 7 的 子 问题 的 最 优 解 。 

(3) d iw, Xj. H. y; 二 1, 则 y= yyin AF RISE W — (ws sw wei} V= 
(uve envia d ,数值 为 j 一 wi; 的 最 优 解 。 

(1)、(2) 的 结论 是 显然 的 ,此 处 仅 就 (3) 展开 讨论 .假定 (yi,y:，… ve. 不 是 子 问题 
W = (uw we etta SV = Cm eve vin) ,数值 为 j 一 wi 的 最 优 解 , 且 其 另 一 个 最 优 解 


il i [mx] il 
Woz = (ritta) Hl Saw <j-—w,H Mav > Y». 于 是 ,有 Saw T 
k=l k=1 k=l k=1 


i-l i 
Uw, xj H D zv tyw > D ywi BP Czy 22 tma y D ÆA W = {w sw tw) 
en k=1 


VY={oyo, ui) ,数值 为 7 的 一 个 比 y 二 (yay,ys，…，,yi) 的 目标 值 更 大 的 解 。 这 与 y= 
Gn yy ,…,y) 是 最 优 解 矛 盾 。 这 说 明 0-1 背包 问题 是 具有 最 优 子 结构 特性 的 。 

BE mli j EEF AW (voy sos ttt wi) V= Coi eve et od ,数值 为 j 的 最 优 解 的 目标 
值 ,其 中 ,i==1,2,…,n,j 二 1,2,…,C。 根 据 最 优 子 结构 特性 ,有 : 


0 i 二 0 或 j=0 
m[i.j] = ymli-—1,7] i>OHw>j (8-13) 
max (v; +mli—1,j—wi],mli—1.j]} i>OHw<j 
3x — 4 GE DX GE DAI m[0..5.0..C].. (E SET RISE W= {2.3.4.5} V — (34.5.7). 
C-—9,.np DTE HIT fi ARE m o 
i j 0 1 2 3 4 5 6 7 8 9 
0 0 0 0 0 0 0 0 0 0 0 
1 0 0 3 3 3 3 3 3 3 
2 0 0 3 4 4 7 7 i 7 7 
3 0 0 3 4 5 7 8 9 9 12 
4 0 0 3 4 5 7 8 10 11 12 


在 此 例 中 ,计算 m[2, 门 时 多 次 用 到 mx[2,1] 的 计算 ,如 图 8-6 所 示 。 因 此 ,0-1 背包 问 
题 是 具有 子 问 题 重 琶 特 性 的 。 注 意 ,此 定义 中 ,二 维 数 表 m 的 行 标 和 列 标 都 是 从 0 开始 编 
号 的 。 


2. 计算 最 大 价值 


利用 0-1 背包 问题 的 最 优 子 结构 ,并 考虑 其 子 问题 的 重 和 至 性 ,可 以 写 出 下 列 自 底 向 上 计 
算 最 大 价值 的 动态 规划 算法 。 


KNAPSACK(Cv ze. C) 
1 n--length[ v) 
2 for j--0 to C 
3 do m[0.j]--0 
4 for i--1 ton 
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m[4.9] 
25 m[3.4] 
PEN mi2.5] mi24] Yes 
m[1.5 m[12] m[14] m[1.1] 


] 
m[0,5] m[0,3]m[0,2]. m[0,0] [0,4] m[0,2]. — m[0,1] 


图 8-6 0-1 FRAT eee 


5 do m[i,0]--0 

6 for j<-1 to C 

7 do m[i.j]*7mLi—1.j] 

8 if w<j 

9 then if v; +mli—1,j—w;]>mli—1,j] 
10 then m(i,j ]<-v; +m[i—1,j—w, ] 
11 return m 


算法 8-8 计算 0-1 背包 问题 中 最 大 价值 的 KNAPSACK 算法 


算法 中 的 第 2 行 和 第 3 (119 for 循环 ,以 及 第 4 一 10 行 的 for 循环 中 的 第 5 行 是 按 
式 (8-13) 计 算 最 底层 的 子 问题 最 优 解 的 值 。 


3. 构造 一 个 最 优 解 
利用 KNAPSACK 返回 的 矩阵 冯 , 可 以 构造 出 最 优 解 。 


BUILD-SOLUTION(myzoyC) 

1 n<length(w] 

2j—C 

3 for i<-n downto 1 

4 do if m[i.j]—m[i—1.j] 


5 then z[;]«-0 

6 else x[i]<1 

7 jc—j—ui] 
8 return x 


算法 8-9 利用 算法 8-8 返回 的 矩阵 构造 0-1 背包 问题 最 优 解 的 BUILD-SOLUTION 算法 


算法 根据 定理 8-2 Bah (8-13). 4 AMG mlij]=mli— 1l jw] Ho 时 ,第 i 件 物品 
放 入 背包 内 (第 6 行 zx; 置 为 1) ,否则 必 有 mm[i, 门 =m[i 一 1, 门 , 即 第 i 件 物品 不 放 入 背包 内 
(第 5 4 cli JHA 0). 


4. 算法 的 运行 时 间 


过 程 KNAPSACK 中 ,第 2 行 和 第 3 行 的 for 循环 耗 时 8(n) ,第 5 一 10 行 的 两 个 嵌 套 的 
for 循环 ,外 层 重复 nn 次 ,里 层 重复 C 次 .循环 体内 消耗 常数 时 间 , 所 以 该 过 程 的 时 间 复 杂 度 
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是 OC) ,而 过 程 BUILD-SOLUTION 的 时 间 复 杂 度 显然 是 OC), 
8.3.3 程序 实现 


由 于 很 多 应 用 可 模型 化 为 0-1 背包 问题 ,所 以 将 算法 8-8 和 算法 8-9 实现 为 程序 是 有 
实用 价值 的 。 
1. 计算 最 大 价值 


lint * knapsack(int * w,int * v.int n,int c) ( 


2 int * m=Cint * )malloc((n+1) * (c+1) * sizeofCinD) ,i,j; 

3 forG=0;j<c+1;j++) 

4 m[j]—0; / * m[0,j]<-0 * / 

5 for(i=1si<=nsit++){ 

6 mi * (e+1)]=0; / * mLi,0]<0 * / 

7 forG=1;j<=csj++){ 

8 m[i* (e+) +jJ=m[G—-1 * (c 十 1) 十 让 / * mLij]-7mLi-1;j] * / 
9 if(wli-1]<=)) 

10 if(m[G—D * (c 十 1) 十 j 一 w[i 一 1]] 十 v[i 一 1 之 m[(i 一 1) * (c+1)+j]) 
11 mli * C+D tj] m[G— D * (c 十 1) 十 j 一 w[i 一 1]] 十 v[i 一 1]; 

12 } 

13: } 

14 return m; 

15 } 


程序 8-10 ”实现 算法 8-8 KNAPSACK 过 程 的 C 函数 


对 程序 8-10 的 说 明 如 下 。 

(1) 与 算法 KNAPSACK 相 比 ,函数 knapsack 除了 质量 数组 w、 价 值 数组 v、 背 包容 量 c 
3 个 参数 以 外 ,还 多 一 个 说 明 物 件 样 数 的 参数 ,也 就 是 数组 w 及 v 的 元 素 个 数 的 n。 

(2) 仍然 用 一 维 数组 按 行 优先 方式 存储 矩阵 。 第 4 行为 数组 m 分 配 存储 Cn 十 1) X Co 1) 
矩阵 所 需 空间 。 

(3) 程序 代码 与 算法 伪 代 码 的 结构 几乎 一 致 ,需要 注意 的 是 用 一 维 数组 表示 的 矩阵 的 
元 素 访问 方式 。 


2. 构造 最 优 解 
对 算法 8-9 的 实现 如 下 。 


1 int * buildSolution(int * m.int n.int * w.int c){ 
2 int i,j=c; 

3 int * x= (int * )malloc(n * sizeof(int)) ; 

4 for(i=n;i>=1;i——) 

5 if(m[i * (c 十 1) 十 门 一 一 m[L(i 一 1) * (c 十 1) 十 门 ) 
6 x[i-1]—0; 

7 else{ 


401 


从 算法 到 程序 (第 2 NO 


8 xLi—1]=1; 
j-—wli-1]; 

10 } 

11 return x; 

12} 


程序 8-11 实现 算法 8-9 的 C 函数 


函数 buildSolution 除了 具有 和 矩阵 m\ 质 量 数组 w 和 背包 容量 c 3 个 参数 以 外 ,还 多 了 一 
个 说 明 物 件数 的 mn。 代码 结构 与 算法 伪 代 码 结构 一 致 ,此 处 不 再 赣 述 。 

程序 8-10 及 程序 8-11 定义 的 函数 存储 在 文件 夹 dprog 中 的 源 文件 knapsack. c 中 , 它 
们 的 原型 声明 存储 于 同一 文件 夹 的 头 文件 knapsack. h 中 ,以 备 重用 。 


8.3.4 应 用 


1. 温馨 旅程 
Happy Travel 


Description 

May Day is coming. Ray and Amy decide to have a travel during the holiday in such a 
wonderful spring. Due to the long vocation, many things should be packed. Both Amy and 
Ray owns a bag with an infinite capacity and they come to a conclusion that all the things 
such as food, drink, tent will be loaded into these two bags. Caring for each other, they 
wanted the difference between the weights of the two bags can be minimized. Of course. 
Ray's bag is always not lighter than that of Amy. 

Input 

Input file contains multiple test cases. For each test case.an integer NC(1<N<100) 
appeals on the first line indicating the number of things should be loaded. The next line 
will be N integers no more than 100000.denoting the weight of each thing. Proceed to the 
end of the file. 

Output 

Output two integers for each test case.denoting the total weight of Amy's and Ray's 
bag respectively. Please output as the format in the Sample Output. 

Sample Input 

2 

56 


3 
135 


Sample Output 


Case 1: 5 6 
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Case2:45 


1) 问题 描述 与 分 析 

Amy 和 Ray 外 出 徒步 春游 ,携带 了 若干 件 行李 ,每 件 行李 都 有 各 自 的 质量 (整数 ) 。 
他 们 相互 关爱 ,不 愿 让 对 方 比 自己 更 累 , 想 把 行李 分 成 质量 相当 的 两 份 各 自 携带 。 本 
题目 实际 上 是 要 求 一 个 整数 集合 A( 各 件 行李 的 质量 ) 的 一 个 划分 : By 和 B (分 别 表示 
Amy 和 Ray 携带 的 各 件 行李 的 质量 ),B;m B:= 人 9.B,U Bs — A. f f. B, 和 B: 的 元 
素 之 和 间 的 差 最 小 (两 人 相互 爱护 尽量 不 让 对 方 比 自己 更 累 )。 可 以 把 此 问题 形式 化 
为 如 下 。 

输入 : 整数 集合 A。 

输出 : 整数 集合 Bl MB. 的 元 素 之 和 ww Hu. HB, AB, 是 A 的 一 个 划分 , 且 差 
值 |rw 一 we | 为 最 小 。 

设 A 中 物品 的 质量 {a ,as au) 之 和 为 W ,车 将 A 中 物品 的 质量 {al ,as sau) 同时 
视 为 这 些 物品 的 价值 ,并 设 W/2 为 背包 承重 量 C, 则 可 以 把 这 个 问题 转化 为 一 个 0-1 背包 问 


Bs 在 > ra: <C RAT AE Ù za, 的 值 最 大 。 


2) 程序 实现 
利用 程序 8-10 很 容易 写 出 解决 Happy Travel 问题 的 C 程序 。 


1 int mainO t 
2 FILE * f1— fopen("chap08/Happy Travel/inputdata., txt" ,"r") , 
3 * [2— fopenC"chap08/ Happy Travel/outputdata, txt" ,"w"); 
4 int n, * w, * m,c,k—1,i; 
5 assert [18.8.[2) ; 
6 while ! feof(f1)) ( 
7 fscanfCf1, " 6d" &-n); /* 读 取 行 李 件数 */ 
8 assert(w= (int * )malloc(n * sizeof Cint) )); 
9 for(i=0,c=0;i<nsit++){ /* 读 取 每 件 行李 的 质量 */ 
10 fscanf(f1,"%d",w+i); 
11 c 十 一 w[i; /* 计算 总 质量 * / 
12 } 
13 m=knapsack(w.w,n,c/2); /* 计算 不 超过 总 质量 一 半 的 最 大 值 * / 
14 fprintfCf2, "Case 26d: %d %d\n" k++ m[n * (c/24- D 3-c/2].c—m[n * (c/22-D -c/2; 
15 freeCw) ; 
16 } 
17  fclose(f1) , felose({2) ; 
18 return 0; 
19 } 
程序 8-12 解决 Happy Travel 问题 的 C 程序 
o @ 表 示 空 集合 
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对 程序 8-12 的 说 明 如 下 。 

COD 第 2 行 和 第 3 行 分 别 打 开 输 入 文件 电 和 输出 文件 {2。 输 入 文件 由 若干 案例 数据 构 
成 ,每 个 案例 包含 两 行 数据 ,第 1 行 仅 含 1 个 整数 n 表示 有 多 少 件 行李 。 第 2 行 包 含 n 个 表 
示 每 件 行李 质量 的 整数 。 

(2) 变量 w 表示 保存 各 件 行李 质量 的 数组 ,m 表示 保存 各 层 子 问题 最 优 解 值 的 数 表 ， 
c 表 示 行 李 的 总 质量 ,k 表示 案例 号 ,i 为 循环 控制 变量 。 

(3) 按 输入 文件 格式 ,第 6 一 16 行 的 while 循环 对 每 个 案例 重复 执行 。 每 次 重复 中 ,第 
7 43 HL 中 读 取 行 李 件数 n, 第 9 一 12 行 的 for 循环 读 取 m 件 行李 的 质量 w[ 癌 并 计算 总 质量 c. 
第 13 行 调 用 程序 8-10 定义 的 函数 knapsack, 质 量 数 组 为 w, 价 值 数 组 也 为 w, 背 包 承 重量 为 
c/2 的 背包 问题 计算 各 层 子 问题 最 优 解 值 , 返 回 m, mEn * (c/2 十 1) 十 c/2] 表 示 二 维 数 表 中 元 
素 m[n,c/2], 它 表示 最 顶层 问题 的 最 优 解 的 值 , 也 就 是 质量 不 超过 c/2 的 最 重 的 行李 子 集 的 
总 质量 ,这 应 该 归 女 孩 Amy, 男 孩 Ray 无 论 如 何 还 是 应 该 在 体力 方面 照顾 女孩 的 ,他 带 的 行李 
质量 为 一 mLnx (c/2 十 1) 十 c/2]。 第 14 行将 这 两 个 数据 写 入 输出 文件 {2。 

程序 8-12 存储 在 文件 夹 chap08/Happy Travel 中 的 源 文件 HappyTravel. c 中 。 


2. 导游 的 算盘 
The Cicerone's Abacus 


Description 

Currently for the requirement of the sightseers. many cicerones often take them to 
shopping for some souvenirs in addition to the introduction of the local culture and historic 
sites. Some souvenir shops give the cicerones who bring sightseers some kickbacks in 
order to make them bring more. The amount of the kickback is determined by the value of 
the goods. The shops usually list the values of the goods and the relevant kickbacks for 
the cicerones to make them clear of the reward they can earn from each kind of goods. 

Assume the cicerone has known the maximum amount of money every sightseer 
intends to spend and the trust of the sightseers on him. The sightseers will buy all 
souvenirs in any quantity recommended by the cicerone only if their maximum budgets are 
kept. Before going to the shop. the cicerone starts calculating which goods he should 
recommend to which sightseer so as to make himself obtain the maximum kickbacks. 
Unfortunately,this is such a hard problem for him that he never works it out. 

Luckily.the cicerone meets you who is good at programming. so he hopes you can 
program to finish this job. Assume the shop has enough quantity of every goods to meet 
the shopping requirement of all sightseers. 

Input 

The input file contains multiple test cases. For each case the first line includes a 
positive integer » representing the number of sightseers who intend to buy souvenirs. The 
second line includes n integers each of which is the maximum budget (positive integer and 


less than 2000) each sightseer plans to spend. There is a positive integer m (m— 101) in 
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the following line indicating the categories of the goods. Then comes m lines. Each line 
has two integers. The first is the price p of the goods (p=1000) and the second is the 
value of the relevant kickback (no more than 0. 2p). 

Output 

For each test case output one line contains the maximum value of the kickback the 
cicerone can obtain. 

Sample Input 

3 

200 300 300 

5 

122 

204 

305 

505 

100 18 


Sample Output 
160 


D 问题 的 描述 与 分 析 

旅游 纪念 品 商家 对 带领 旅客 来 店 购买 商品 的 导游 给 予 回扣 奖励 。 回 扣 量 取决 于 旅客 们 
购买 的 商品 数量 。 商 家 对 m 种 纪念 品 的 每 一 种 都 列 出 了 价格 和 给 导游 的 回扣 , 记 m 件 物品 
TY BYARD P= {pis Poste + Pm) FU Ko {ki ho este sm} o SP DEAL REA UE TE de & E E I 
钱 购买 纪念 品 ,n AP Ui e 9 WI BET C — (e cz ,cs}。 每 种 物品 货源 丰富 ,游客 可 在 预 
算 条 件 下 , 按 导 游 的 建议 任意 购买 。 问 题 是 导游 应 建议 各 位 游客 购买 哪些 物品 , 买 多 少 能 使 
自己 得 到 的 回扣 最 多 ? 

对 任何 游客 j 而 言 , 类 似 一 个 0-1 背包 问题 : 每 种 纪念 品 的 价格 P= pis pos bu FI 
成 质量 数组 ,每 种 纪念 品 对 应 的 回扣 额 构成 价值 数组 K — Ut ,ko，…,k,) ,而 游客 的 预算 额 c 
视 为 背包 承重 量 。 然 而 ,这 个 模型 与 0-1 背包 模型 的 不 同 之 处 在 于 : 0-1 背包 问题 中 ,每 件 物 


品 要 么 放 和 背包, 要么 留 下 ,而 在 本 问题 中 ,一 种 纪念 品 可 以 被 游客 购买 1 件 、2 件 ……, 仅 受 
游客 预算 额 c 的 限制 。 这 样 ,需要 设法 将 本 问题 的 模型 转化 为 0-1 背包 模型 。 
我 们 可 以 想象 ,旅游 商店 为 方便 顾客 ,将 第 i 种 纪念 品 分 成 1 件 包装 ,2 件 包装 ，…… ,最 


A x del pe 是 满足 + (zx 十 1)p;/2<c; 的 最 大 值 ?。 这 样 ,这 些 包 装 好 的 东西 可 以 视 为 0- 
1 背包 模型 中 的 物品 了 ,有 确定 的 价值 ,确定 的 回扣 额 ,要 么 留 下 .要 么 装 入 包 中 。 
确切 地 说 ,对 第 j 号 游客 ,将 第 i 件 物品 扩展 为 m;“ 件 ”物品 ,其 价格 为 {p; ,2 ,3pi;，…， 
mipi) ,回扣 为 {ki,2k;,3k;,… smki} o HEP m; = max{x | x EN,zr(r 二 1)p;/2 <S c). 
i 二 1,2,…,m。 也 就 是 说 把 1 件 i 号 物品 ,2 件 i 号 物品 ,…… smi 件 i 号 物品 视 为 新 的 m; 件 


O ”对 第 i 种 纪念 品 ,游客 j 购买 1 件 包装 的 需 付 p; 元 ,购买 2 件 包装 的 需 付 2p; 元 ,……, 他 (/ 她 ) 可 以 购买 这 种 纪念 
品 受 pi 十 2pi 十 3pi… 十 Tp; 三 cj 的 限制 ,而 pi 十 2pi; 十 3p;… 十 zpi 二 x(Z 十 1)pi/2, 故 最 多 可 购买 的 量 受 zx(z 十 1) =p;/2<c; 
的 限制 。 
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物品 ,而 m 是 游客 ) 最 多 能 购买 的 i 号 物 唱 数 .把 U Usos 2 pe 3pm mpi) 中 的 m = 


Do, 个 新 的 物品 的 价格 记 为 (0 pe! pu I 239 mds 中 的 由 个 新 
MERIDIANE (K, e ) , 则 可 将 一 个 游客 的 购物 问题 可 转化 为 0-1 音 包 问题 在 
Sap! <c, 的 限制 下 ,最 大 化 汪 

“等 个 游客 对 应 的 子 问题 都 解决 ,所 得 的 最 优 值 之 和 就 是 原 问题 的 最 优 值 。 


2) 算法 的 伪 代 码 描述 
将 上 述 算 法 思想 写成 如 下 的 伪 代 码 过 程 。 


THE-CICERONE-ABACUS( p. 4 .C) 

1 max<-0 

2 n--length[C] 

3 for j--1 ton 

4 do (p, ‚kı )—EXTEND( p, k, COD) 


5 m*-length[ pi ] 
6 matrix*-KNAPSACK (pi hi ,CLj]) 
7 mazx--maz- matrizU m «CLj 11 


8 return max 


算法 8-10 fk The Cicerone's Abacus 问题 的 算法 THE-CICERONE-ABACUS it f£ 
其 中 ,第 4 行 调用 下 列 EXTEND 过 程 对 第 j 个 游客 创建 0-1 背包 模型 。 


EXTEND( 5.4. C) 

1 m--length[ p] 

2 newp*-newk*- Ø 

3 for i<-1 tom 

4 do m, —max(íz|x€ N.xCed- D) p, /2C) 


5 for j<-1 to m, 
6 do append jX p; to newp 
7 append jX k; to newk 


8 return newp and newk 


算法 8-11 将 1 个 游客 的 购物 数据 创建 为 0-1 背包 模型 的 EXTEND LE 


3) 程序 实现 
算法 8-11 将 返回 两 个 数组 对 象 newp 和 newk ,这 对 于 C 函数 来 说 是 办 不 到 的 。 一 个 
可 行 的 解决 办 法 是 将 两 个 对 象 整 合 到 一 个 结构 体 中 。 这 种 情形 在 应 用 中 会 经 常 遇 到 ,函数 
需要 返回 的 多 个 对 象 也 不 限于 整 型 数组 ,可 以 是 各 种 类 型 的 数据 。 因 此 ,定义 如 下 通用 的 序 
偶数 据 类 型 pair。 
typedef struct { /* 用 来 存储 两 个 指针 的 结构 体 * / 
void * firsts 


void * second; 
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) pairs 
并 定义 一 个 根据 两 个 指针 数据 创建 pair 对 象 的 函数 make. pair. 
pair make pair(void * f,void * d){ 
pair p={f,d}; 
return p; 
) 
将 此 类 型 定义 及 函数 make. pair 的 原型 声明 存储 在 文件 夹 utility 中 的 头 文件 pair. h 中 ,而 
将 函数 make. pair 的 定义 存储 在 同一 文件 夹 内 的 源 文件 pair. c 中 ,以 备 重用 。 
做 了 这 些 准 备 工 作 后 , 先 来 实现 算法 8-11。 


1 pair extendCint * p.int * k,int * m,int C){ 


2 int * newp, * newk, * ml ,newm,x.i,j.t; 

3 assert(m1 — (int * ) malloc( C * m) * sizeof(int) )) ; 

4 for(i=0,x=1;i< * m;i+ +){ 

5 while(x * (x+1) * p[i]/2<0)x+ +; / * 计算 max{zlzEN,z (z+1) p,/2Xcj) * / 
6 ml(i]^x; 

T } 

8 for(i=0,newm=0;i< * mi;i 十 十 ) / * 计算 newp 和 newk 的 长 度 * / 

9 


newm+=ml[i]; 
10 assert(newp= (int * )malloc(newm * sizeof(int) )) ; 
11 assert(newk= (int * )malloc(newm * sizeof (int) )) ; 


12 for(i=0,t=0;i< * msit++) / * 计算 数组 newp 和 newk * / 

13 for(j=03j<ml1[i];j++.t++){ 

14 newp[t]— G-- D) * p[i]; 

15 newk[t]— (+D * ki]; 

16 ) 

17 free(m1) ; 

18 *m=newm; / * m #7] newp 和 newk 的 长 度 * / 
19 return make pair( newp.newk) ; 

20 } 


程序 8-13 ”实现 算法 8-11 的 C 函数 


对 程序 8-13 的 说 明 如 下 。 

(1) 与 算法 过 程 相 比 ,函数 extend 除了 表示 纪念 品 价格 的 数组 p、 回 扣 额 数组 k 和 游客 
预算 额 C 以 外 ,还 多 了 一 个 表示 数组 p 和 k 的 元 素 个 数 的 参数 m。 该 函数 的 任务 就 是 用 py 
k、C 创建 一 个 合适 的 0-1 背包 模型 ,包括 质量 数组 和 价值 数组 。 所 以 ,返回 值 类 型 是 上 述 的 
pair。 此 外 ,由 于 C 语 言 的 数组 不 含有 数组 长 度 的 属性 ,所 以 将 表示 pk 的 长 度 的 参数 m 定 
义 成 指针 类 型 ,这 样 既 可 以 作为 表示 p、k 的 长 度 ,也 可 向 外 部 传递 新 的 数组 newp 和 newk 
的 长 度 。 

(2) 函数 体内 声明 了 作为 返回 对 象 的 数组 newp 和 newk, 用 来 暂 存 各 种 纪念 品 最 多 包 
装 数 的 数组 m1。newp 和 newk 的 长 度 需 在 运行 时 确定 ,所 以 用 指针 来 表示 。 虽 然 ml 的 长 
度 为 传递 进来 的 参数 m 的 值 , 但 C 语言 数组 定义 中 元 素 个 数 需 为 常量 , 故 不 得 已 也 将 其 定 
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义 为 指针 。 

(3) 函数 代码 的 结构 与 算法 过 程 的 结构 也 略 有 不 同 。 算 法 中 newp 和 newk 可 视 为 可 
变 长 线性 表 , 而 是 将 两 者 定义 成 由 指针 指引 的 数组 。 所 以 ,必须 先 计 算出 它们 的 长 度 。 第 
4~7 行 的 for 循环 对 每 一 种 商品 i 计算 最 大 的 x, 使 得 x(x 十 1) p,/2C OS 5 FAY while fff 
环 完成 ) ,并 将 值 保存 在 ml[ 让 中 。 第 8 行 和 第 9 行 的 for 循环 累加 数组 ml 中 的 元 素 ,得 到 
数组 newp 和 newk 的 长 度 newm。 第 12—16 行 的 两 重 for 嵌 套 循环 对 应 算法 过 程 中 的 第 
3 一 7 行 的 for KEMAH TE TE newp 和 newk 个 元 素 的 值 。 第 19 行将 此 两 者 整合 与 一 个 
pair 对 象 中 座位 函数 值 返回 。 注 意 ,此 前 的 第 18 行将 newm 赋值 给 m 指向 动态 变量 ,以 此 
方式 将 newp 和 newk 的 长 度 带 出 。 

利用 extend 函数 和 程序 8-10 定义 的 函数 knapsack ,将 算法 8-10 实现 为 如 下 函数 。 


1 int theCiceronesAbacusCint * p.int * k,int m.int * C,int n){ 
int max=0,j, * pl, * k1, ml, * matrix; 
pair r; 
for(j—0; j€n; j++){ 
ml 一 my 
r 一 extend(p,k,&ml,C[j]); /* 将 psk\C[j] 创 建 为 0-1 背包 模型 * / 
pl=r. first; k1— r. second; 
matrix=knapsack(pl,k1,m1,C[j]); 
max 十 一 matrix[ml * (C[j]2- D -C[j1]s 
10 free pl) ,free(kl) , freeCmatrix) ; 
11 ) 


12 return max; 


程序 8-14 ”实现 算法 8-9 的 C 函数 


对 程序 8-14 的 说 明 如 下 。 

(1) 与 算法 过 程 相 比 ,函数 theCiceronesAbacus 多 了 两 个 参数 : 数组 p M k AJKE m, 
数组 C 的 长 度 n。 该 函数 以 一 个 案例 的 最 优 解 的 值 一 一 导游 对 一 批 游客 购买 纪念 品 所 得 的 
最 多 回扣 (整数 值 ) 。 

(2) 由 于 extend 函数 的 第 3 个 参数 m 一 身 兼 二 任 : 向 函数 传递 数组 p 和 下 的 长 度 ,向 
外 部 传递 扩展 后 的 数组 newp 和 newk 的 长 度 ,所 以 需要 新 设置 一 个 变量 ml 来 扮演 这 一 角 
色 。 其 他 变量 的 设置 与 算法 过 程 中 的 同名 同意 。 

(3) 函数 的 代码 结构 与 算法 过 程 的 结构 十 分 接近 ,需要 注意 的 是 用 pair 类 型 整合 了 
extend 返回 的 两 个 数组 对 象 , 所 以 用 第 7 行将 它们 还 原 成 pl、kl。 此 外 ,函数 knapsack 
( 见 程序 8-10) 返 回 的 matrix 是 按 行 优先 原则 存储 在 一 维 数组 中 的 矩阵 ,所 以 第 9 行 访问 
matrix m1 *〈C[ 订 十 1) 十 CU] 相当 于 访问 matrix[ m1. C[3]]. 

利用 程序 8-13 和 程序 8-14 解决 The Cicerone's Abacus 问题 的 main 函数 设计 如 下 。 

1 int main(){ 

2 FILE * fl=fopen("chap04/The cicerone's abacus/inputdata. txt","r"), 


3 * f2— fopen(" chap04/The cicerone's abacus/outputdata. txt" ," w"); 
4 int * p, * k, * Com, n,i; 
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5 assert({1& &{2) ; 

6 while( ! feof(f1)){ 

7 fscanf(f1,"%d",&n) ; 

8 assert(C= (int * ) malloc(n * sizeof(int) )) ; 
9 for(i—0;i-n;ic +) 

10 ÍscanfCf1, " 4d" CF D; 

11 fscanf({1,"%d", &-m); 

12 assert( p— (int * )malloc(m * sizeof (int))); 
13 assert(k= (int * ) malloc(m * sizeof(int) )) ; 
14 for(i=0;i<m;i+ +) 

15 fscanf(f1,"%d %d",pti,k+i); 

16 fprintfCf2, " % d\n" ,theCiceronesAbacus(p,k,m,Cyn)) ; 
17 free(p) ,free(k) ,free(C) ; 

18 ) 


19  fclose(fD) , felose(f2) ; 
20 return 0; 


程序 8-15 解决 The Cicerone's Abacus 问题 的 C 程序 


程序 中 第 6 一 18 行 的 while 循环 处 理 输 入 文件 中 的 每 一 个 案例 。 其 中 ,第 7 行 读 取 本 
案例 中 的 游客 数 n。 第 8 一 10 行 读 取 读 取 每 个 游客 的 预算 金额 CLi]. 98 11 行为 本 案例 中 
的 商品 种 数 m。 第 12 一 15 行 读 取 每 一 种 商品 的 价格 pL] els kEi. 58 16 行 调用 程序 8-14 
定义 的 函数 theCiceronesAbacus ,计算 导游 得 到 的 最 大 回扣 值 . 并 写 和 人 输出 文件 {2 中 。 

程序 8-13 一 程序 8-15 存储 在 文件 夹 chap08/The Cicerone's Abacus 中 的 源 文件 


The cicerone’sabacus. c 中 。 
8.4 带 权 有 向 图 中 任意 两 点 间 的 最 短路 径 


8.4.1 问题 描述 


设 G 王 天 V,E> 为 一 有 向 图 ,个 顶点 用 前 ?个 正 整数 编号 , 即 V— (1.2... AG 
的 每 一 条 边 (i,j) EE, 对 应 一 个 非 负 距 离 值 wij] AG. AEEM w[i, 门 二 =。 我 们 约 
定 , 对 每 一 个 i€ V wli] =, H.-P M BUG I EI G— —V .E- n] EAUJH— 4 Xn 的 矩 
阵 W 加 以 表示 ,如 图 8-7 所 示 。 

我 们 的 问题 是 要 找 出 图 G 中 的 每 一 个 顶点 到 其 他 所 有 顶点 的 距离 。 此 处 ,顶点 ij 间 
的 距离 定义 为 从 i 出 发 到 j 的 最 短路 径 长 度 。 这 是 一 个 组 合 优化 问题 ,从 i 出 发 到 j 可 能 有 
若干 条 路 径 , 每 条 路 径 都 有 其 长 度 ,目标 是 找到 i 到 j 长 度 最 短 的 路 径 。 问 题 形式 化 为 
如 下 。 

GA: 表示 有 向 带 权 图 G— —V ,E 二 的 nXn 和 矩阵 W。 

输出 : 对 任意 的 zjJE V ,i 到 j 间 的 距离 及 最 短路 径 。 
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03 8 9-4 
E 0 = 1 1 
W |oo 4 0 ce 
29-5 0 c 
e» co c 6 0 
图 8-7 一 个 有 向 带 权 图 
8.4.2 算法 设计 与 分 析 
l. 最 优 子 结构 
用 动态 规划 策略 来 解决 这 个 问题 。 首 先 需要 考虑 问题 的 最 优 子 结构 特性 ,把 它 总 结 成 
如 下 定理 。 


定理 8-3. iE G— —V .E- f Wi A A e f DR ij € V — (01,2. n) p 是 从 i 到 j 其 间 
仅 经 过 { 1,2,…,k} 的 最 短路 径 。 
CD 车 pp 不 经 过 顶点 k, 则 p 也 是 从 i 到 达 j 其 间 仅 经 过 {1,2,…,k 一 1) 的 最 短路 径 。 
(2) 车 pp 经 过 顶点 k, 即 pii k j。 我 们 把 前 半 段 i k 记 为 p1, 后 半 段 & j dU p. 
( 见 图 8-8)。 则 p, 是 从 i 到 k 其 间 仅 经 过 {1,2,…,k 一 1) 的 最 短路 径 ,ps 是 k 到 j 其 间 不 经 
过 {1,2,…,k 一 1) 的 最 短路 径 。 
pi: 所 有 中 间 项 点 都 在 {1,2…,k-1} 中 ”ps: 所 有 中 间 顶 点 都 在 {1,2…, 人 -由 中 


Pi © Pi 


PARADAN? -kh 
图 8-8 最 短路 径 的 最 优 子 结构 


证 明 〈1) 的 结论 是 显然 的 ,此 处 仅 就 (2) 展 开 讨论 。 假 定 ps 不 是 从 i 到 k 其 间 仅 经 过 
人 ,2,… ,一 1) 的 最 短路 径 , 而 从 i 到 其 间 仅 经 过 {1,2,…,k 一 1) 的 最 短路 径 为 pi WE p 
中 将 p 置换 成 pi ,将 得 到 一 条 比 p 更 短 的 从 i 到 达 j 其 间 仅 经 过 {1,2,…,k) 的 路 径 p 
这 与 p 是 从 i 到 j 其 间 仅 经 过 {1,2,…,k} 的 最 短路 径 巴 盾 。 同 理 ,可 得 对 p. 的 结论 。 

定义 dj 为 i 到 j 且 其 间 仅 通过 {1,2,…,k} 的 最 短路 径 长 度 。 显 然 ,d?,j 为 i 到 j 的 权 ， 
而 dt 为 到 j 的 最 短路 径 长 度 。 根 据 上 述 的 任意 点 对 间 最 短路 径 问 题 的 最 优 子 结构 特性 ， 
我 们 有 关于 dt 的 递归 式 : 

dc: w[i.jl k= 

T min (dE; ,dti dij) 1<k<n 
由 此 递归 式 的 定义 可 知 子 问题 具有 重 和 至 性 。 记 : 


(8-14) 
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Di = ju: 二 
则 D, 将 记录 G STA D SOM G. j) B BL 
2. 计算 任意 点 对 的 距离 
利用 上 述 关于 di 的 递归 式 , 用 自 底 向 上 、 记 表 备 查 的 方式 计算 各 个 D, 的 算法 如 下 。 
FLOYD-WARSHALL(OW) 
1D,—W 
2 for k--1 ton 
3 do for i<-1 ton 
4 do for j<-1 ton 
5 if Dia Lj] Di Li £1 Di Dj] 
6 then D,[i,j]- Dii [ij] 
7 else D, [ij] D, [i 8] Dia [kj] 
8 


return D, 


算法 8-12 ”计算 带 权 有 向 图 所 有 顶点 对 距离 的 FLOYD- WARSHALL 算法 


算法 中 第 1 行 按 式 (8-14) 中 k=0 的 条 件 计算 De 。 第 2 一 7 行 按 式 (8-14) 中 1-— en 
的 条 件 , 自 底 向 上 计算 D, 中 的 元 素 ,此 算法 称 为 Floyd 算法 。 显 然 , 算 法 的 时 间 复 杂 度 为 
Or). 

由 于 FLOYD-WARSHALL 是 以 自 底 向 上 的 方式 计算 矩阵 Di, 且 计算 时 , 仅 用 到 Dy KY 
数据 ,所 以 可 以 仅 保留 当前 矩阵 用 来 计算 下 一 步 矩 阵 而 省 略 更 早 的 计算 结果 ,将 算法 改进 成 
如 下 形式 。 

FLOYD-WARSHALL(W) 

1 DW 

2 for k--1 to n 

3 do for i<-1 ton 

4 do for j--1 ton 

5 if Di. jT Di &]-- DA j] 

6 then D[i,j]<—D[i,k]+ DE. j] 


算法 8-13 算法 8-12 的 改进 版 本 


3. 构造 一 个 最 优 解 


为 了 构造 最 优 解 一 一 任意 项 点 对 (i,j) 的 最 短路 径 , 必 须 记 录 路 径 上 的 顶点 序列 ,用 跟 
踪 路 径 上 每 一 个 顶点 的 前 驱 来 达到 这 一 目的 : x 佑 定义 为 从 顶点 i 到 j 的 中 间 顶 点 均 在 集合 
{1,2,…,) 中 的 最 短路 径 上 顶点 j 的 前 驱 。 则 
_ (NIL i=j Rwy =% 
(M izj Hw,«oo 


x (8-15) 


X RE1, 
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那么 x 
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Tij 
Tay 


(4-1) 


(1) 


(1) (G-1) 
df” <d? 

(e1) (G-1) 
dj” > dz 


GD 
T di 


(k—1) 
kj 


(8-16) 


就 是 顶点 对 (i,j) 的 最 短路 径 中 j 的 前 驱 顶 点 。 可 以 进一步 修改 算法 8-13, 使 得 它 
能 够 同时 计算 出 矩阵 五 = (xi? ),x,( 见 图 8-9)。 
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FLOYD-WARSHALL(W) 

1 for i<-1 ton 

2 do for j~-1 to n 

3 do if i=j or W[i,j]—99 
4 then II[i,j]<-NIL 
5 else II[ i. ]--i 

6 D—-W 

7 for k41 to n 

8 do for i<-1 to n 

9 do for j<-1 ton 


IIO= 


no- 


no- 
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noe- 
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运行 算法 8-14 过 程 中 的 计算 结果 
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10 it Dij T^ DL &]H- De j] 

11 then D[i,j ]<-D[i,k]+D[k,j] 
12 Oli jlo, j] 

7 return D.II 


算法 8-14 ”能 在 线 计算 前 驱 矩 阵 的 FLoyD-WARSHALL 算法 


算法 的 第 1 一 5 行 按 式 (8-15) 将 I 初始 化 为 了 I, 第 6 行将 DD 初始 化 为 Dy ,第 7 一 12 行 按 
式 (8-14) 及 式 (8-16) 自 底 向 上 地 计算 D, 及 IL。 由 于 第 1~5 行 的 for 循环 仅 耗 时 O) , 故 算 
法 的 运行 时 间 仍 为 8Ce ) 。 

利用 算法 8-14 返回 的 前 驱 和 矩阵 荆 , 可 以 构造 出 顶点 对 (i,j) 的 最 短路 径 。 

PRINT-ALL-PAIRS-SHORTEST-PATHSC IL, i , j) 

lifi-j 

2 then print i 
else if II[;,; ]— NIL 

then print "no path from" i "to" j "exists" 

else PRINT-ALL-PAIRS-SHORTEST-PATHS(II, i, II[ i. j ]) 

print j 


3 
4 
5 
6 
算法 8-15 ”打印 顶点 对 (ij) 的 最 短路 径 的 算法 
由 于 一 条 简单 路 径 最 多 含有 个 顶点 ,所 以 最 多 进行 n 次 递归 。 因 此 该 算法 的 时 间 复 
AE 96). 
8.4.3 程序 实现 


有 向 带 权 图 项 点 间 的 最 短 距 离 是 很 多 应 用 的 模型 ,实现 Floyd 算法 是 有 实际 意义 的 。 
1. 计算 任意 点 对 距离 
在 C 语 言 中 可 以 如 下 实现 算法 8-14。 


1 pair floydWarshall(double * w,int n){ 


2 double * d= (double * )malloc(n * n * sizeof(double) ) ; 

3 int i,j,k, * pi= (int * ) malloc(n * n * sizeof(int)); 

4 for(i=0;i<n;it++) 

5 for(j=0;j<nsj++) 

6 ifG==i || wli* n+j]>=DBL_MAX) / * if i=j or W[i,j]]799 * / 
7 pili * n+j]=—1; / * pLisjJ<-NIL * / 
8 else 

9 pili * n+j]=i; / * pli,j]<i* / 

10 memcepy(d, w.n * n * sizeof( double) ) ; /*D-Wx*/ 

11 for(k=1;k<=n;k++) 

12 for(i=0si<nsit++) 

13 for(j=0;j<n;j++) 

14 if(d[i * nt+j]>d[ix* nat-k—-1]4- d[ Ck— D * nj Dt 
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15 d[i* n+j]=d[i* n 十 k 一 1] 十 d[(k 一 1) * nj]; 
16 pili * n+j]=pil(k—D * n+j]; 

17 } 

18 return make_pair(d, pi); 

193 


程序 8-16 ”实现 算法 8-14 的 C 函数 


对 程序 8-16 的 说 明 如 下 。 

(1) 函数 floydWarshall 除了 表示 图 G 的 矩阵 w 作为 参数 以 外 ,还 多 了 一 个 表示 图 G 
的 顶点 个 数 的 参数 n。 和 前 两 节 一 样 ,用 一 维 数组 来 存储 这 个 表示 图 的 和 矩阵。 由 于 算法 要 
返回 两 个 矩阵 D 和 本 ,所 以 需要 在 8. 3. 3 节 中 开发 的 数据 类 型 pair 作为 返回 值 类 型 ,其 中 
封装 了 计算 所 得 的 矩阵 d 和 pis 

(2) 第 2 行 和 第 3 行 声明 了 两 个 一 维 数组 d 和 pi 并 为 它们 分 配 了 存储 空间 。 它 们 分 别 
表示 FLOYD-WARSHALL 算法 中 的 矩阵 D f IL, 

(3) floydWarshall 函数 体 中 的 第 4 一 17 行 对 应 于 FLOYD-WARSHALL 算法 中 第 1 一 12 
行 的 操作 。 需 要 注意 的 是 C 代码 和 伪 代 码 中 关于 数组 下 标 起 点 值 的 区 别 , 以 及 用 一 维 数组 
表示 的 矩阵 元 素 的 访问 形式 。 注 意 第 6 行 认 语句 的 检测 条 件 中 借用 DBL_MAX 表示 ce ,该 
常量 表示 double 型 数据 的 最 大 值 ,定义 于 头 文件 float h。 由 于 检测 的 是 双 精 度 浮 点 数据 的 
相等 关系 ,所 以 用 的 是 二 二 运算 符 。 第 18 行 调用 函数 make. pair 将 计算 而 得 的 矩阵 4 和 pi 
封装 到 pair 对 象 中 ,并 将 其 返回 。 


2. 构造 最 优 解 
利用 floydWarshall 计算 并 返回 的 矩阵 pi, 可 实现 构造 最 优 解 的 算法 8-15. 


1 void printAllPairsShortestPath(int * pi,int n,int i,int j){ 


2 ifi-—jl 

3 printfC" 4d ",i+1); 

4 return; 

5 } 

6 if(pili * n+ jJ==—1) / * if plis j]J=NIL * / 
7 printf("no path from %d to %d exists. \n",i 十 1,j 十 1); 
8 else{ 

9 printAllPairsShortestPath(pi n.i. pi[i * n+j]) s 

10 printfC" 4d ",j-- D; 

11 } 

12) 


程序 8-17 实现 算法 8-15 的 C 函数 


对 程序 8-17 的 说 明 如 下 。 

(1) 与 算法 过 程 相 比 ,该 函数 除了 以 矩阵 pi、 当 前 路 径 端 点 i 和 j 作为 参数 以 外 ,还 多 了 
一 个 表示 pi 的 阶 数 的 参数 n。 函 数 直接 显示 最 优 解 ,而 无 返回 值 。 

(2) 函数 体内 的 代码 结构 与 算法 过 程 的 伪 代 码 十 分 接近 ,需要 注意 的 是 由 于 pi 是 整 型 
数组 ,其 中 的 元 素 表示 图 中 顶点 编号 1 一 n, 故 用 一 1 表示 算法 过 程 中 的 NIL( 第 6 行 )。 此 
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外 ,图 中 顶点 编号 与 数组 下 标 对 应 ,而 C 语言 的 数组 下 标 从 0 开始 ,所 以 第 3 行 、 第 6 行 输出 
的 顶点 编号 为 i 十 1 和 j 十 1。 

程序 8-16 和 程序 8-17 定义 的 函数 存储 在 文件 夹 dprog 中 的 源 文件 floyd. c 中 ,它们 的 
原型 声明 存储 于 同一 文件 夹 中 的 头 文件 floyd. h 中 ,以 备 重用 。 


8.4.4 ”应 用 一 一 牛牛 聚会 


Bronze Cow Party 


Description 

One cow from each of N farms (1 < N < 1000) conveniently numbered 1.. N is 
attending the big cow party to be held at farm # X (1<X<N), Each of M (1 M«— 
100.000) bidirectional roads connects one farm to another. It is always possible to travel 
from one farm to another on the roads, Traversing road i requires T, (1 T; 100) units of 
time. One or more pairs of farms might be directly connected by more than one road. 

After all the cows gathered at farm # X.they realized that every single cow left her 

party favors back at the farm. They decided to suspend the party and send all the cows 
back to get the party favors. The cows all travel optimal routes to their home farm and 
back to the party. What is the minimum number of time units the party must be 
suspended? 

Input 

* Line 1: Three space-separated integers.respectively: N.M.and X. 

* Lines 2.. M-- 1; Line ¿+1 describes road i with three space-separated integers, 
respectively: A;.B;.and T;. The described road connects A, and B; and requires T; 
time units to traverse. 

Output 

* Line 1; One integer: the minimum amount of time the party must be suspended. 

Sample Input 

482 

127 

138 

144 

218 

231 

312 


346 
422 


Sample Output 


6 
1. 问题 描述 与 分 析 
nn 个 来 自 不 同 的 农场 的 牛牛 相聚 在 牛牛 zx 的 家 中 。 它 们 发 现 没 带 Party 礼物 ,只 好 各 
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自 回 家 去 取 。 问 晚会 至 少 要 延迟 多 久 。nn 个 牛牛 所 在 的 农场 可 视 为 图 中 的 nn 个 顶点 。m 条 
农场 间 道 路 及 沿路 行走 所 需 时 间 可 视 为 顶点 间 的 边 及 其 所 具有 的 权 值 。 值 得 注意 的 是 ,所 
有 的 道路 都 是 双向 的 。 所 以 , 若 输 入 数据 中 两 个 农场 间 有 两 条 并 行 的 道路 , 则 应 选择 费时 少 
的 那 一 条 ,如 图 8-10 所 示 。 和 牛牛 i 从 顶点 zx 出 发 回 到 顶点 i 有 一 条 最 短路 径 , 且 从 顶点 i 返 
回 顶点 xz 也 应 当 有 一 条 最 短路 径 . 两 者 所 用 时 间 之 和 是 牛牛 i 回 到 派对 所 需 最 短 时 间 。 问 
题 是 要 求 出 所 有 的 牛牛 按 最 短 时 间 往 返 所 用 时 间 的 最 大 者 。 


图 8-10 输入 样本 对 应 的 带 权 有 向 图 


问题 可 表示 为 如 下 。 

MA. 表示 带 权 ww 的 有 向 图 G 二 过 V,E 志 的 矩阵 WW, 顶 点 xz。 

输出 : maxicie, (yi | y, — PU c EIUS 所 需 最 短 时 间 十 从 顶点 i 到 顶点 x 所 需 最 短 
HY Tia} 。 


2. 算法 描述 


显然 ,可 以 利用 算法 8-14 的 FLOYD-WARSHALL 算法 (或 算法 8-11, 因 为 无 须 计 算 拢 
Ve 了 I) 计算 出 任意 项 点 对 的 距离 矩阵 D。D 的 第 z 行 表 示 各 个 牛牛 从 z 回 到 各 自 农场 所 需 
最 短 时 间 ,D 的 第 zx 列表 示 各 个 牛牛 从 自己 的 农场 把 礼物 带 回 Party 所 需 的 最 短 时 间 ,将 两 
者 对 应 元 素 相 加 得 到 各 个 牛牛 往返 所 需 时 间 , 其 中 的 最 大 者 就 是 问题 所 求 。 

BRONZE-COW-PARTY(W ,7x) 

1 D--FLOYD-WARSHALL(OW) 

2 for ix-1 ton 

3 do time[ i] D z i] - D[ is] 

4 return SELECT(time, 1 ,n,n) 


算法 8-16 ”解决 Bronze Cow Party 问题 的 算法 过 程 
其 中 ,过 程 SELECTGA por ESS 3 章 3.2.3 节 引入 的 选择 序列 A[p..r] 中 第 i 大 元 
素 算法 3-8。 
3. 程序 实现 
利用 程序 8-12 的 函数 floydWarshall, 可 将 算法 8-16 实现 如 下 。 


1 double bronzeCowParty(double * w,int n,int x){ 
2 double * time, * d. result; 

3 int i; 

4 pair p; 
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5 assert(time= (double * ) malloc(n * sizeof(double))) ; 

6 p= floydWarshall(w,n) ; 

T d=p. first; 

8 for(i=0;i<n;i ++) 

9 time[i]—d[i* n+ x— D ]-- dL (x— D * nci]; 

10  free(; 

11  result— * (double * )(select(time.sizeof( double) ,0,n—1,n—1,doubleGreater) ) ; 
12 free(time) ; 


13 return result; 


程序 8-18 ”实现 算法 8-16 的 C 函数 


对 程序 8-18 的 说 明 如 下 。 

CD 与 算法 过 程 相 比 ,也 数 bronzeCowParty 除了 表示 图 的 矩阵 的 数组 w 和 举办 聚会 的 
牛牛 编号 x 作为 参数 外 ,还 多 了 一 个 表示 图 中 顶点 数 的 参数 n。 本 来 问题 中 涉及 的 数据 都 
是 整 型 的 ,但 是 程序 中 需 调用 floydWarshall 函数 , 按 程序 8-16 中 的 定义 ,该 函数 返回 的 数 
组 对 象 d 是 浮 点 型 的 。 所 以 ,用 d 中 元 素 计算 所 得 的 本 函数 的 返回 值 就 是 浮 点 型 的 。 

(2) 函数 中 定义 了 与 算法 过 程 中 同名 同意 的 数组 time 和 d, 但 由 于 函数 floydWarshall 
返回 的 是 pair 型 对 象 , 所 以 还 需 声明 一 个 接收 loydWarshall 返回 值 的 pair 型 变量 p。 

(3) 函数 题 中 的 代码 结构 与 算法 过 程 的 代码 结构 几乎 一 致 。 需 要 注意 的 是 ,与 算法 过 
程 直接 返回 SELECT 返回 值 不 同 , 函 数 中 用 变量 result 接收 select 的 返回 值 ,这 是 因为 , 需 
要 在 函数 运行 结束 前 释放 动态 数组 time 的 空间 。 

利用 程序 8-18 写 出 下 列 解决 Bronze Cow Party 问题 的 程序 。 


1 int mainO( 
FILE * f1—fopen("chap08/Bronze Cow Party/inputdata, txt","r"), 
* {2=fopen("chap08/Bronze Cow Party/outputdata. txt" ,"w") ; 
int n,m,x,t,a,b,i,js; 


2 
3 
4 
5 double * w; 
6 
[4 
8 
9 


assert({1& & 2) ; 
fscanf(f1,"%d %d %d",&-n,&m,&x); /* 读 取 顶 点 数 n、 边 数 m 和 顶点 编号 xx / 
assert(w 一 (double* )malloc(n * n * sizeof( double) )) ; 
for(i 一 0;i<ni;i 十 十 ) /* 初 始 化 权 和 矩阵 * / 
10 for(j—0;j—n;jd- +) 
11 ifi-—p 
12 wL[i * n+j]=0. 0; 
13 else 
14 wli* nt-j]- DBL MAX; 
15 for(i=0;i<m;i++){ 
16 ÍscanfCf1,"?6d %d 96d" ,&a, & b, &t); / * ERR a b 及 a,b HAA t / 
17 if(wl(a— D * ncb-1]70 
18 w[(a— D * nt-b—-1]—w[(b—1) * n+ (a—1) J=t; 
19 ) 


20  fprintf(f2." 96. Of\n", bronzeCowParty(w.n,x)); 
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21 free(w); 

22  fclose(f1) , fclose(f2) ; 
23 return 0; 

24] 


程序 8-19 解决 Bronze Cow Party 问题 的 程序 


对 程序 8-19 的 说 明 如 下 。 
CD 第 7 行 从 输入 文件 中 读 取 图 中 顶点 个 数 n、 图 中 边 数 m 和 指定 顶点 编号 x。 第 8 行 
用 读 到 的 n 为 表示 图 的 权 和 矩阵 的 数组 w 分 配 空间 。 
(2) 第 9 一 14 行 的 for 循环 将 w 初始 化 为 如 下 形式 : 
0 co E oo 


co 0 = oco 


co oo . 0 

第 15 一 19 行 的 for 循环 从 输入 文件 中 读 取 m 条 边 的 信息 ,并 用 其 创建 图 的 权 和 矩阵 w。 
其 中 ,第 17 行 和 第 18 行 的 证 语句 对 满足 读 到 的 边 (a,b) 之 权 值 + 小 于 w[a,b], 则 将 
w[a,bj] 的 值 改写 为 t+。 由 于 之 前 将 矩阵 非 对 角 线 上 的 元 素 初 始 化 为 = ,所 以 第 一 次 处 理 的 
边 信息 一 定 会 更 新 w[a,b], 若 ab 间 有 两 条 平行 边 , 则 按 此 证 语句 的 条 件 , 必 将 维持 权 较 小 
的 那 条 边 。 

(3) 第 20 行将 调用 bronzeCowParty 函数 得 到 的 值 写 到 输出 文件 中 。 

程序 8-18 和 程序 8-19 定义 的 函数 存储 在 文件 夹 chap08/Bronze Cow Party "P fff ii xc 
件 BronzeCowParty. c 中 ,读者 可 打开 研读 并 运行 验证 。 
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SET BOR e UC F 458 P VE CRIT" [R18 RC AN AN UC A IRL ved «TV A) FD LXI 7 1 
有 效 地 加 以 计算 。 如 果 一 个 组 合 优化 问题 除了 最 优 子 结构 特性 外 ,还 具有 一 些 更 深入 的 特 
性 , 则 可 以 用 更 特殊 的 方法 来 提高 算法 的 效率 。 本 章 就 来 讨论 一 种 称 为 贪 禁 选 择 ” 的 方法 。 
适合 于 运用 贪 禁 选择 方法 的 问题 ,除了 具有 最 优 子 结构 之 外 还 要 具有 贪 禁 选 择 性 质 一 HI 
顶 向 下 对 每 一 个 子 问题 计算 到 目前 为 止 最 优 的 部 分 解 。 这 样 , 最 终 得 到 的 解 对 于 原 问 题 而 
言 是 最 优 的 。 具 有 最 优 子 结构 性 质 和 贪 禁 选 择 性 质 的 问题 ,可 以 用 贪 禁 选 择 策略 设计 出 高 
效 的 算法 。 


9.1 活动 选择 问题 


9.1.1 算法 描述 与 分 析 


l. 问题 的 理解 与 描述 


回顾 在 第 7 章 7. 3. 1 节 中 讨论 过 的 相 容 活动 问题 。 假 定 及 个 需要 使 用 同一 个 诸如 教 
室 这 样 的 资源 的 活动 S= (ai sas au) ,每 次 只 能 有 一 个 活动 使 用 该 资源 。 每 一 个 活动 有 
一 个 开始 时 间 s[aij ,一 个 完成 时 间 /Lai] ,其 中 Ssa] < fLa;]- 09. FIA a; 被 选取 ， 
We fe ALKA RK fal sa] fla DARA. 活动 a; Ma, 是 相 容 的 ,如 果 区 间 [s[Laij， 
f[aij) 和 [sLajj,fLajj) 不 相交 ( 即 如 果 sla; J> fla; ]9X sla, 12 f/La;]«a; la; 相 容 )。 活 动 
选择 问题 是 选取 一 个 由 相 容 活动 构成 的 最 大 集合 。 例 如 ,考虑 下 列 活动 集合 S, 其 中 活动 按 
完成 时 间 的 单调 增加 顺序 排列 : 
i 12 34 5 6 7 $ 9 10 11 
s] 4 3 05 3 5 6 8 8 2 12 
fla] 4 56 7 8 9 10 11 12 13 14 
不 久 就 会 看 到 把 活动 排序 的 好 处 。 在 此 例子 中 , 子 集 {a; ,as ,an } 由 相 容 活动 组 成 。 但 它 不 
是 最 大 的 ,因为 {a ,as sas ,an} 是 更 大 的 这 样 的 子 集 。 SEE {a ,at ,as ,an } 是 一 个 最 大 的 
相 容 活动 的 子 集 ; 另 一 个 最 大 的 子 集 是 {a ,as ,as ,aa }。 这 是 一 个 组 合 优化 问题 : S 的 任何 
一 个 子 集 都 是 一 个 可 能 解 , 相 容 活动 构成 的 子 集 为 可 行 解 。 每 一 个 可 行 解 都 以 其 所 含 活动 
个 数 作为 目标 值 。 目 的 是 找到 一 个 目标 值 最 大 的 可 行 解 。 
输入 : 按 完成 时 间 排 好 序 的 活动 组 S= (ai ,az nau) 
输出 : 表示 一 个 最 大 的 相 容 活动 组 的 向 量 {xz ,zz,…,z) ,其 中 
— (1 活动 ai 在 此 最 大 相 容 活动 组 中 
2|, sm 7 


i= 10.2. 
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2. 最 优 子 结构 


由 于 所 有 可 能 解 对 应 2" 个 向 量 {z zz, ,zzE(0,1) ,i 二 1,2,…,n。 所 以 用 回 漳 
算法 的 时 间 复 杂 度 是 O(2")。 为 了 提高 算法 效率 , 先 来 考察 该 问题 是 否 具 有 最 优 子 结构 特 
性 。 为 此 ,定义 集合 : 

Sj = {a E€ S : fla] < sla] € fla] < sla]? 
也 就 是 说 S; 是 由 所 有 与 a; 和 a; 相 容 的 活动 构成 ,这 些 活动 也 与 所 有 不 迟 于 a; 完成 而 完成 
以 及 不 先 于 aj 的 开始 才 开始 的 活动 相 容 。 为 表示 整个 问题 ,添加 两 个 假想 的 活动 a。 和 
an HAR fla l=0 及 [ai] 王 ce。 于 是 S=So+i, 而 ;和 7 的 取 值 范围 为 0 委 记 ， 
j&€ntl, 

由 于 假定 各 活动 按 完成 时 间 的 单调 增加 顺序 排列 : 

flao] S flar] S fLa2] & < flan] < flan] 

根据 S, 的 定义 ,显然 只 要 >j RA S; =。 于 是 , 子 问 题 空间 是 在 S; 0i ji 
ntl 中 选取 最 大 的 相 容 活动 子 集 。 假 定 S, 的 一 个 解 包含 活动 ai, 所 以 fla] sa] — 
FLai]sLa;]. Alas 产生 两 个 子 问题 ,Sa (发 生 在 a; 完成 以 后 且 完 成 于 ax 发 生 之 前 的 活 
动 ) 和 Sy RAE FE ay 完成 以 后 且 完 成 于 a; 发 生 之 前 的 活动 ) ,每 一 个 都 构成 S; 中 的 活动 的 
子 集 。 设 A; 是 S; 的 一 个 最 优 解 ,a € A;。 则 A; 中 Sa WSR Aa 和 Si 的 解 A 必 也 是 最 优 
的 。 这 是 因为 ,车 Sa 有 一 个 比 Aa 所 包含 的 活动 更 多 的 解 A ,我 们 可 以 把 Aa 从 A; 中 切除 
并 粘贴 As ,就 会 产生 Sy 的 另 一 个 比 Ay 包含 更 多 活动 的 解 。 由 于 假定 Ay 是 一 个 最 优 解 ,这 
得 出 了 一 个 矛盾 。 类 似 地 ,可 以 说 明 Au FE Su 的 一 个 最 优 解 。 

现在 利用 此 最 优 子 结构 来 计算 最 优 解 的 值 。 设 c[i, 门 为 5; 的 最 大 相 容 活动 子 集中 的 
活动 数 , 则 : 

0 Sy =O 
dójl- max(clik]+elkjl+1) SØ 


到 此 为 止 ,可 以 写 一 个 基于 上 式 的 动态 规划 算法 。 


DYNAMIC-ACTIVITY-SELECTOR(S) 
1 n Gength[ S] 

2 for i--0 to n1 

3 do for j--0 to n+1 


4 do c[;.j]--0 

5 for /<-2 to n 

6 do for i<-1 to 一 /十 1 

d do j4-id1—1 

8 for &--ic-1 to j—1 

9 do if sla: J>fla;] and fla: ]s[a; ] 
10 then t<-cli,k]+clksjJ+1 
11 ECL 

12 then cli,j]<t 


算法 9-1 解决 活动 选择 问题 的 动态 规划 算法 


420 


第 9 章 RER 


不 难 分 析 , 该 算法 的 时 间 复 杂 度 是 O0z )。 为 了 进一步 提高 算法 效率 ,下 面 来 考察 该 问题 
另 一 个 有 趣 的 特性 。 从 <[, 放 的 定义 可 见 , 为 了 计算 i<j 时 的 Lief] EREESE max (clink I+ 
ckj] H ,这 里 有 两 个 层次 的 计算 : 首先 ,k 从 i 十 1 到 j 一 1 的 循环 ;其 次 , 解 两 个 子 问 题 
c[i,kj] 和 c[k,j]。 设 想 如 果 能 一 步 就 确定 的 值 并 且 能 减少 计算 一 个 子 问 题 ,就 一 定 能 大 
大 地 提高 算法 的 效率 。 定 理 9-1 揭示 了 在 活动 按 完 成 时 间 排 好 序 的 前 提 条 件 下 ,确实 能 在 
这 两 个 方面 改进 算法 。 


3. 贪 楚 选择 性 


定理 9-1 考虑 任 一 非 空 子 问题 5; ,并 设 an 为 Sy 中 最 早 完成 的 一 个 活动 ; 
flan] = min { fla] :a, € Ss} 

则 

CL) 活动 an 包含 在 5; 的 一 个 最 大 相 容 活动 子 集合 中 。 

(2) 子 问题 5 是 空 的 ,所 以 选择 a 将 使 得 Sw 成 为 仅 有 的 非 空子 问题 。 

为 说 明 第 一 部 分 ,假定 A; 是 5; 的 一 个 最 大 相 容 活动 子 集合 ,并 将 AS 中 的 活动 按 完成 
时 间 单 调 增加 的 顺序 排列 。 设 as 是 A; 中 的 第 一 个 活动 。 若 a 二 a ,就 完成 了 证 明 , 因 为 已 
经 说 明 a, 是 S; 的 一 个 最 大 相 容 活动 子 集合 的 成 员 之 一 。 若 autas WETEA Ay = 
A; — la.) U {aa)。Asy 中 的 活动 是 互 不 相交 的 ,这 是 因为 w 是 Ar 中 第 一 个 完成 的 活动 , 且 
fm 三 /1。 注 意 As 和 A 所 含 的 活动 数 一 样 ,我 们 知道 As 是 5; 的 一 个 包含 a 的 最 大 相 容 活 
动 子 集 。 

接 下 来 说 明 第 二 部 分 。 假 定 Sw 非 空 ,所 以 有 活动 w 使 得 f La; ] s La, I< f La, JS 
slam ]— f La, ] ,而 as 也 在 Sj 中, 而且 是 一 个 比 an 完成 得 更 早 的 活动 ,此 与 a 的 选择 矛盾 。 
我 们 推出 S, 是 空 的 。 


4. 算法 的 伪 代 码 描述 


定理 9-1 说 明 如 果 “ 贪 整地 ” 取 Sy 中 最 先 完成 的 活动 ww, 则 第 1 个 结论 告诉 我 们 该 活动 
必 存 在 于 该 问题 的 一 个 最 优 解 中 。 第 2 个 结论 则 确定 了 无 须 计算 c[i,z] ,因为 子 问题 Sw 
是 空 的 。 于 是 只 需要 递归 地 解决 子 问题 Sw 。 这 样 ,就 可 以 自 项 向 下 地 对 每 一 个 活动 确定 
是 否 含 在 一 个 最 大 相 容 集中 。 


RECURSIVE-ACTIVITY-SELECTOR (S4i+j) DS= (ai saz s**t san} 


lm-icl 

2 while m<j H sla, ]— f[a;] bk S, 中 的 第 一 个 活动 
3 do x,,+-0 

4 m=m+1 

5 if m<j 

6 then z,,<-1 

7 RECURSIVE-ACTIVITY-SELECTOR(S,m,j) 


算法 9-2 解决 活动 选择 问题 的 递归 算法 


算法 运行 于 一 个 活动 组 的 例子 如 图 9-1 所 示 。 
图 9-1 中 ,RECURSIVE-ACTIVITY-SELECTOR 运行 于 前 面 给 出 的 11 个 活动 。 每 次 递归 
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k k h 
jk wo ch Ce C40 Qd ob oh (305 ck 40 co bo di 
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调用 所 考虑 的 活动 位 于 两 条 水 平 线 之 间 。 假 想 的 活动 ao 在 时 间 0 完成 。 并 在 首次 调用 
RECURSIVE-ACTIVITY-SELECTOR(s,/,0,12) 中 ,活动 a, 被 选取 。 在 每 一 次 递归 调用 中 ,已 
经 被 选取 的 活动 加 了 阴影 ,显示 为 白色 的 活动 正 被 考察 。 若 一 个 活动 的 开始 时 间 发 生 在 最 
近 加 入 的 活动 完成 之 前 (两 者 之 间 的 箭头 朝向 左边 ) ,. 它 被 拒绝 。 和 否则 的 话 (箭头 朝 上 或 朝 
Ai) , 它 被 选取 。 最 后 一 次 递归 调用 RECURSIVE-ACTIVITY-SELECTOR(s, f. 11,12) ,返回 
D. EMM RG BH (a, ,as ,as san} o 

由 于 过 程 RECURSIVE-ACTIVITY-SELECTOR 是 “末尾 递归 ”。 将 一 个 末尾 递归 过 程 转 
换 为 与 之 等 价 的 迭代 形式 往往 是 很 直接 的 。 

GREEDY-ACTIVITY-SELECTOR(S) b S= a.a; 7.2.) 

1 n<length[S] 
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2 for i<-1 ton 

3 do x;<-0 

4a<1 

5i-—1 

6 for m-—2 to n 

d do if sla, ]> f[a;] 


8 then zw< 1 
9 icm 
10 return x 


算法 9-3 解决 活动 选择 问题 的 迭代 算法 
5. 算法 的 运行 时 间 
显然 ,GREEDY-ACTIVITY-SELECTOR 的 运行 时 间 是 8 G0 ,这 比 动态 规划 算法 的 OG) 
好 得 多 。 由 此 可 见 , 对 于 具有 最 优 子 结构 特性 的 组 合 优化 问题 , 若 还 具有 贪 禁 选 择 特性 
总 是 选择 目前 的 最 优 部 分 解 ,上 且 该 部 分 解 包含 于 一 个 全 局 最 优 解 中 一 一 则 可 进一步 提高 算 
法 效率 。 


9.1.2 程序 实现 


1. 实现 要 点 


要 将 一 个 算法 的 伪 代 码 过 程 实现 为 一 个 程序 过 程 (函数 或 方法 ) ,需要 考虑 过 程 与 外 部 
通信 的 机 制 一 一 参数 与 返回 值 ,前 者 对 应 于 问题 的 输入 ,后 者 对 应 于 问题 的 输出 。 程 序 过 程 
中 运行 时 需要 设置 的 数据 变量 以 及 如 何 向 计算 机 解释 伪 代 码 中 高 度 抽象 的 表达 ,或 如 何 利 
用 语言 所 具有 的 特点 来 实现 伪 代 码 的 特殊 表达 。 在 把 算法 9-1 的 伪 代 码 过 程 实现 为 程序 过 
程 时 ,也 遵循 这 样 的 思路 。 

【参数 与 返回 值 】 程序 过 程 和 算法 伪 代 码 一 样 ,参数 包括 分 别 表示 活动 的 起 始 时 间 数 
组 ;、 完 成 时 间 数 组 /、 当 前 活动 组 起 始 编 号 i 和 终点 编号 。 它 们 的 类 型 都 应 该 是 整 型 的 。 
若 解 向 量 作 为 全 局 变量 , 则 该 过 程 无 返回 值 ;否则 需要 返回 解 向 量 ( 一 个 整 型 的 一 维 数组 ) 。 

【数据 设置 】 可 以 和 算法 9-1 那样 ,将 解 向 量 x 设置 为 全 局 变量 。 其 实 , 它 可 以 通过 参 
数 传递 给 该 函数 。 此 外 还 需要 设置 一 个 整 型 变量 m 作为 循环 控制 变量 。 

【关键 代码 】 伪 代 码 十 分 简单 ,可 以 直接 转换 为 程序 代码 。 


2. 程序 实现 
用 C 语言 可 以 很 轻松 地 实现 算法 9-3。 


1 typedef struct{ 


2 double s; 
3 double f; 
4 ) Active; 


5 int activeComp( Active * a, Active * b)( 
6 if(a—>f>b->f) 
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7 return 1; 

8 if(a->f<b->f) 
9 return — l; 
10 return 0; 

n} 


12 int * greedyActivitySelector( Active * a,int n){ 


13 int i,m, * x= (int * )calloc(n.sizeofCint ) ; 


14 assert(x) ; 

15 qsort(a,n,sizeof( Active) ,activeComp) ; 
16 for(x[0]=1,i=0,m=1;m<n;m++) 
17 if(a[m]. s>=aLi]. D( 

18 x[m]=1; 

19 i=m; 

20 ) 

21 return x; 

22 } 


程序 9-1 实现 算法 9-3 的 C 代码 


对 程序 9-1 的 说 明 如 下 。 

CD 第 1 一 4 行将 活动 定义 成 具有 两 个 属性 s、f 的 结构 体 类 型 Active。 为 适应 各 种 应 
用 ,属性 s 和 f 的 类 型 均 为 double 类 型 。 

(2) 第 5 一 11 行 定义 的 函数 activeComp 对 由 两 个 参数 指针 a.b 指引 的 活动 比较 完成 
时 间 f 的 大 小 。 它 是 对 活动 组 进行 排序 的 比较 规则 。 

(3) 第 12—22 行 定义 的 函数 greedyActivitySelector 实现 算法 9-2。 该 函数 的 第 1 个 参 
Boa 表示 活动 数组 ,第 2 个 参数 n 表示 a 中 的 活动 个 数 。 与 算法 过 程 一 样 ,函数 返回 表示 a 
中 的 一 个 最 大 相 容 子 集 的 向 量 x。 由 于 a 中 活动 未 必 按 完成 时 间 排 好 序 , 所 以 第 15 行 调用 
库 函 数 qsort, 传 递 activeComp ,对 a 按 完成 时 间 升 序 排序 。 函 数 体内 其 余 代码 与 算法 9-1 
的 伪 代 码 十 分 接近 ,读者 可 对 比 阅 读 。 


91.3 贪 禁 算法 与 动态 规划 


值得 注意 的 是 ,并 非 所 有 具有 最 优 子 结构 特性 的 组 合 优化 问题 都 具有 贪 禁 选择 特性 。 
考察 下 列 两 个 问题 。 

0-1 背包 问题 : 有 件 物品 ,第 i 件 物品 价值 为 v; ,质量 为 wi ,其 中 v Aw, ERA i 
望 尽 可 能 地 用 背包 带 走 质 量 为 w 的 值钱 东西 (对 于 每 件 物品 ,要 么 留 下 ,要 么 整 件 带 走 ) ,其 


中 C 是 整数 。 问 题 是 应 该 带 走 哪些 东西 ? 即 在 Prae < Cony € (061) ,i 二 1,…,n 的 限制 
ici 


FRAKE D wio 


部 分 背包 问题 : A n 件 物品 ,第 i 件 物品 价值 为 v;, 质 量 为 wi;, 其 中 v; Bl w 是 整数 。 
希望 尽 可 能 地 用 背包 带 走 质 量 为 w 的 值钱 东西 (对 于 每 件 物品 ,可 以 带 走 一 部 分 ), 其 中 C 


424 


第 9 章 RER 


是 整数 。 问 题 是 应 该 带 走 哪些 东西 ? 即 在 leue <C € [0,1],i = Lee wn 的 限制 下 ， 


最 大 化 2 ro。 

这 两 个 背包 问题 都 呈现 出 最 优 子 结构 性 质 。 对 0-1 背包 问题 而 言 , 其 最 优 子 结构 特性 
已 经 在 第 3 章 中 阐述 。 对 于 部 分 背包 问题 而 言 , 若 从 最 优 装载 中 移 除 质量 为 w 的 物品 j 38] 
下 的 必 是 要 带 走 的 至 多 质量 为 C 一 w 最 有 价值 的 原 一 1 种 物品 和 质量 为 wj 一 ww 的 物品 j。 

虽然 两 个 问题 很 相似 ,车 对 每 一 种 物品 计算 单位 价值 wy/rw 。 贪 禁 策略 是 依次 取 走 尽 
可 能 多 的 单位 价值 最 高 的 物品 。 部 分 背包 问题 可 以 用 贪 禁 策略 加 以 解决 ,而 0-1 背包 问题 
却 不 行 ,实例 见 图 9-2。 所 以 ,在 用 贪 焚 策 略 解决 一 个 组 合 优化 问题 之 前 需要 仔细 考察 它 的 
最 优 子 结构 特性 和 贪 禁 选 择 特性 。 

图 9-2(a) 中 ,选择 3 个 物品 的 一 个 子 集 ,质量 不 超过 50。 图 9-2(b) 中 ,0-1 背包 问 
题 的 最 优 子 集 包 含 物品 2 和 物品 3。 任 一 含有 物品 1 的 解 都 不 是 最 优 的 ,尽管 物品 1 
具有 最 大 的 每 磅 价值 。 图 9-2(c) 中 ,对 部 分 背包 问题 ,依次 取 最 大 的 单位 价值 物品 导 
致 最 优 解 。 


20 
30| $80 
ed 30| $120 
+ 
item2 + 30|$120 
H 20| $100 20| $100 

pii 30 P 
m 20| $100 z = 
10|$60 — |10| $60 10| $60 


it 
$60 $100 $120 knapsack -$220 -$160 -$180 -$240 
(a) 


一 般 说 来 ,如 果 一 个 问题 具有 最 优 子 结构 就 可 以 考虑 用 动态 规划 ,只 有 当 问 题 同时 还 具 
有 贪 禁 选 择 性 时 ,才能 利用 贪 禁 策 略 提高 算法 效率 。 


9.1.4 应 用 一 一 海岸 雷 


Radar Installations 


Assume the coasting is an infinite straight line. Land is in one side of coasting.sea in 
the other. Each small island is a point locating in the sea side. And any radar installation. 
locating on the coasting.can only cover d distance.so an island in the sea can be covered by 
a radius installation.if the distance between them is at most d. 

We use Cartesian coordinate system. defining the coasting is the z-axis. The sea side 
is above x-axis.and the land side below. Given the position of each island in the sea. and 
given the distance of the coverage of the radar installation. your task is to write a program 
to find the minimal number of radar installations to cover all the islands. Note that the 


position of an island is represented by its zy coordinates. 
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Input 

The input consists of several test cases. The first line of each case contains two 
integers n (1<n<1000) and d. where n is the number of islands in the sea and d is the 
distance of coverage of the radar installation. This is followed by n lines each containing 
two integers representing the coordinate of the position of each island. Then a blank line 
follows to separate the cases. 

The input is terminated by a line containing pair of zeros. 

Output 

For each test case output one line consisting of the test case number followed by the minimal 
number of radar installations needed. "— 1" installation means no solution for that case. 


Figare 9-3 is a sample input of radar Installations. 


图 9-3 A Sample Input of Radar Installations 


Sample Input 


32 
12 


=31 
21 


12 
02 


00 
Sample Output 


Case 1; 2 
Case 2; 1 


l. 问题 描述 与 分 析 


设 海岸 线 为 直角 坐标 系 中 的 x+ 轴 。 xz 轴 上 方 表示 海 , 下 方 表 示 陆 地 。 在 海岸 线 上 安装 
扫描 半径 为 d 的 雷达 监视 位 于 海中 坐标 为 (xi,yi) .i 二 1,2,… on 的 nn 个 岛屿 。 对 一 个 位 于 
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(zx,y) 的 岛屿 来 说 ,能 监视 它 的 雷达 只 能 位 于 作为 海岸 线 的 zx 轴 上 的 区 间 [zx 一 Vay, 
at SE Hy 内。 于 是 ,两 个 这 样 区 间 相交 意味 着 两 个 岛屿 可 被 同一 台 雷 达 所 监视 。 区 间 
不 相交 , 则 意味 着 两 个 岛屿 不 可 能 被 同一 台 雷 达 监 视 。 因 此 ,最 少 的 雷达 安装 数 ,就 是 由 
个 岛屿 的 位 置 所 决定 的 个 区 间 最 大 相 容 (使 用 活动 选择 问题 的 语言 ,此 处 所 说 的 相 容 指 的 
是 两 个 区 间 不 相交 ) 数 。 这 样 ,本 问题 就 可 以 转换 成 活动 选择 问题 了 。 把 问题 形式 化 为 如 下 。 

输入 : 表示 个 岛屿 位 置 坐 标的 两 个 数组 x、y。 

输出 : 区 间 集 合 {[zi 一 Jd? y ox, + Jd? y ]|i 二 1,2,…,n) 的 最 大 不 相交 区 间 构 成 
的 子 集 所 含 区 间 个 数 。 


2. 算法 描述 


利用 活动 选择 问题 算法 过 程 GREEDY-ACTIVITY-SELECTOR 可 将 解决 此 问题 的 算法 伪 
代码 表示 为 如 下 。 


RADAR-INSTALLATION(zx,y) 

1 n<-length[x] 

2 for i--1 ton 

3 do 4x; — Vd — yi 

4 rat | d! — y 

5 按 r 的 升序 对 1 和 排序 

6 z«- GREEDY-ACTIVITY-SELECTOR (1,7) 
7 return z 中 值 为 1 的 元 素 个 数 


算法 9-4 解决 Radar Installations 问题 的 伪 代 码 过 程 


3. 程序 实现 

1 int main() {( 

2 FILE * f1— fopen("chap09/Radar Installations/inputdata. txt" ,"r") , 
3 * [2— fopen(" chap09/Radar Installations/outputdata. txt" ,"w") ; 
4 int n,d,count=0; 

5 assert( f18- 8.2) ; 

6 fscanf(f1,"%d%d", &-n, &.d); 

7 while(n&.&-d) { 

8 int i, * s,min=0; 

9 double x,y,z; 

10 Active * a= (Active * )malloc(n * sizeof( Active) ) ; 

11 for(i 一 0;i 一 nji 十 十 ){ 

12 fscanf (f1, " %1f%1f" »& x, & y); 

13 z—sqrt(d * d—y* y); / * 计算 JP y */ 
14 ali]. s=x—z; 

15 ali]. f=x+z; 

16 } 

17 s— greedy ActivitySelector(a.n) ; 

18 for(i=0;i<n;i ++) 
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19 min —s[i]; 

20 ÍprintfCf2, "Case %d:%d\n",+-+ count, min); 
21 free(a) ;free(s) ; 

22 fscanf(fl,"%d%d", &n, &-d); 

23 o) 

24 fclose(f1) ;fclose({2); 

25 return 0; 

26 } 


程序 9-2 解决 Radar Installations 问题 的 C 程序 


对 程序 9-2 的 说 明 如 下 。 

(1) 58 2 行 和 第 3 行 设置 输入 、 输 出 文件 全 和 {2。 

(2) 第 6 一 23 行 的 while 循环 处 理 输入 文件 中 的 每 个 案例 。 其 中 第 6 行 读 取 第 一 个 案 
例 的 岛屿 数 n 和 雷达 扫描 半径 d, 第 22 行 在 处 理 完 每 个 案例 数据 后 读 取 下 一 个 案例 的 
n 和 d。 

(3) 循环 体 中 ,第 10 一 16 行 负责 读 取 案 例 中 的 各 岛屿 坐标 ,并 计算 该 岛屿 对 应 的 雷达 安 
装 区 间 , 记录 为 数组 a 中 一 个 元 素 的 sf 属性 。 第 17 行 调用 程序 9-1 中 定义 的 函数 
greedyActivitySelector, 返 回 向 量 s。 第 18 行 和 第 19 行 计算 s 中 为 1 的 分 量 数 作为 变量 min 的 
值 。 第 20 行 将 min 的 值 写 人 输出 文件 (2 中 。 


9.2 Huffman 编码 


9.2.1 算法 描述 与 分 析 


l. 问题 的 理解 与 描述 


Huffman 编码 是 一 种 广泛 应 用 且 非 常 有 效 的 数据 压缩 技术 ;根据 被 压缩 的 数据 特 
征 ,通常 可 以 节省 20% 一 90% 的 空间 。 把 数据 视 为 一 连 串 的 字符 ,Huffman 的 贪 焚 算 
法 利用 一 张 记录 各 字符 发 生 频 率 的 表格 建立 一 个 将 每 个 字符 表示 为 二 进 制 串 的 最 优 
方式 。 

假定 希望 压缩 存储 一 个 具有 100 000 个 字符 的 数据 文件 。 我 们 观察 到 该 文件 中 的 字符 
发 生 的 频率 由 图 9-4 给 出 , 即 仅 有 6 个 不 同 的 字符 , 且 字符 a 发 生 了 45 000 次 。 


a b è d e f 
频率 (单位 为 千 ) 45 13 12 16 9 5 
定 长 编码 字 000 001 010 011 100 101 
变 长 编码 字 0 101 100 111 1101 1100 


9-4 一 个 字符 编码 问题 


有 很 多 种 方式 用 来 表示 这 样 的 信息 文件 。 我 们 考虑 设计 一 种 二 进 制 编码 (简称 为 编 
码 ) ,其 中 的 每 个 字符 表示 为 唯一 的 二 进 制 串 。 若 使 用 定 长 编码 ,需要 3 个 比特 来 表示 6 个 
字符 : a 二 000,b 二 001,…,f 二 101。 这 个 方法 对 整个 文件 编码 需要 300 000 个 比特 。 另 一 方 
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面 , 变 长 编码 通过 赋予 高 频 字 符 短 编码 字 而 低频 字符 长 编码 字 可 以 比 定 长 编码 做 得 好 得 多 。 
图 9-4 展示 了 这 样 的 一 个 编码 ;其 中 用 一 个 比特 的 串 0 表示 a,4 比特 的 串 1100 表示 f. Be 
一 编码 需要 

(45X1 十 13X3 十 12X3 十 16X3 十 9X4 十 5X4) X 1000 = 224 000 比特 
来 表示 文件 ,几乎 节省 25%。 事 实 上 将 看 到 这 是 对 此 文件 的 最 优 字 符 编码 。 

上 例 中 ,无 论 是 定 长 编码 还 是 变 长 编码 ,都 具有 共同 的 特性 : 没有 一 个 编码 字 成 为 另 一 
个 编码 字 的 前 级 ,这 样 的 编码 称 为 前 缀 码 。 

对 前 级 码 来 说 编码 是 很 简单 的 ,只 要 把 文件 中 每 个 字符 的 编码 字 连 接 起 来 就 行 了 。 例 
如 ,用 图 9-4 中 的 变 长 前 级 码 , 对 3 个 字符 的 文件 abe iili 0 * 101 * 100=0101100, JE p 
JH“ e RRE. 

前 级 码 因 为 解码 简便 而 受到 欢迎 。 由 于 没有 哪个 编码 字 是 另 一 个 编码 字 的 前 级 ,一 个 
已 编码 文件 的 第 一 个 编码 字 是 确定 的 。 可 以 直接 识别 首 个 编码 字 , 将 其 转换 为 原 字符 ,然后 
对 剩 下 的 已 编码 文件 重复 此 过 程 。 在 例子 中 , 串 001011101 分 解 成 0。0。101。1101 ,解码 
为 aabe。 为 确定 第 一 个 编码 字 ,利用 一 棵 以 给 定 的 字符 为 树叶 的 二 叉 树 的 表示 方法 。 把 一 
个 字符 的 二 进 制 编码 字 解 释 为 从 根 起 到 该 字符 的 路 径 , 其 中 0 意 为 “行进 到 左 孩 子 ”, 而 1 意 
为 “行进 到 右 孩 子 ”。 图 9-5 展示 了 两 棵 表示 例子 的 编码 树 。 把 这 样 的 用 来 表示 字符 集 前 缀 
码 的 二 叉 树 称 为 一 棵 编码 树 。 注 意 , 编 码 树 中 除了 对 应 于 字符 的 每 一 片 叶 子 有 其 频数 ,每 一 
个 内 点 也 有 其 “频数 ”. 定义 为 它 的 两 个 孩子 的 频数 之 和 。 

图 9-5 所 示 为 对 应 于 图 9-4 的 编码 方案 的 树 。 每 一 片 叶子 标注 了 一 个 字符 及 其 发 生 的 
频数 。 每 一 个 内 点 标示 了 子 树 中 所 含 叶 子 的 频数 之 和 。 图 9-5(a) 对 应 于 定 长 编码 的 树 
a 二 000,…,/ 二 101。 图 9-5(b) 对 应 于 最 优 前 绥 码 的 树 a 二 0,6 二 101,…, /二 1100。 


图 9-5 对 应 于 图 9-4 的 编码 方案 的 树 


给 定 一 棵 对 应 于 前 级 码 的 编码 树 TT, 计算 编码 一 个 文件 所 需 的 比特 数 一 一 文件 长 

度 一 一 是 很 简单 的 。 对 字母 集 C 中 的 每 一 个 字符 c,f(c) 表 示 c 在 文件 中 发 生 的 频数 ， 

dr(c) 表 示 c 的 叶子 在 树 中 的 深度 。 注 意 dr(c) 还 表示 字符 c 的 编码 字 长 度 。 于 是 对 该 文件 
编码 所 需 的 比特 长 度 为 

BCT) = X fdr) (9-1) 


«ec 


把 它 定义 为 树 工 的 代价 。 
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同一 个 文件 的 不 同 的 前 级 码 编码 方案 具有 不 同 的 文件 长 度 。 对 应 于 最 短文 件 长 度 的 前 
级 码 编码 方案 , 称 为 该 文件 一 个 最 优 编码 。 一 个 文件 的 最 优 编码 所 对 应 的 编码 树 必 为 一 棵 
满 二 又 树 9 ,在 树 中 每 一 个 内 点 都 有 两 个 孩子 。 这 是 因为 如 果 编 码 树 不 满 ,总 可 以 得 到 一 棵 
代价 更 小 的 编码 树 。 例 子 中 的 定 长 编码 不 是 最 优 的 ,因为 图 9-5(a) 中 所 示 的 对 应 编码 树 不 
是 满 的 : 有 始 于 10… 的 编码 字 ,但 没有 始 于 11… 的 编码 字 。 将 由 叶子 ef 构成 的 子 树 移 到 
其 父 结 点 处 将 得 到 一 棵 代价 更 小 的 编码 树 ( 当 然 对 应 的 编码 不 再 是 等 长 码 了 )。 若 C 是 字 
母 集 且 所 有 字符 的 频数 都 是 正 的 , 则 对 C 的 一 个 最 优 前 级 码 而 言 , 它 所 对 应 的 满 二 叉 树 具 
有 1C| 片 树叶 ,每 片 叶子 对 应 字母 集中 的 一 个 字符 , 且 恰 有 |C| 一 1 个 内 点 。 

把 问题 形式 化 为 如 下 。 

输入 : 字符 集 C 及 频数 /(c) ,cE€C。 


输出 : 以 C 中 字符 为 叶子 的 满 二 又 树 工 ,使 得 代价 BCT) = D Odro 最 小 。 
EC 
2. 最 优 子 结构 


中 然 这 是 一 个 组 合 优化 问题 。 由 于 一 共有 二] 村 具 及 ETLER 


2|Cl 
ICI 
代价 BCT) 作 为 目标 值 ,目的 是 找 一 棵 目标 值 最 小 的 前 级 码 树 。 该 优化 问题 具有 最 优 子 结 
构 特 性 : 1 T H C 的 一 棵 最 优 前 绥 码 树 ,T 的 两 个 孩子 分 别 为 T M T BEC, 和 Cs 分 别 
是 T, WI T; 中 叶子 所 对 应 的 字符 集 。 显 然 ,CLUC:=C.Cimnc:= 纪 。 则 T, MT, 分 别 为 
C, 和 C, 的 最 优 前 级 码 树 。 若 不 然 , 假 设 对 Ci 而 言 , 有 一 棵 优 于 T, 的 前 级 码 树 Ti BD 
BCT). ÉA TIA T, 为 孩子 的 C 的 前 缀 码 树 T', 必 有 BT) 二 B(T)。 这 与 是 C 的 
一 棵 最 优 前 级 码 树 矛 盾 。 


3. RBA 


按 如 下 的 贪 禁 策 略 来 构成 一 棵 前 绥 码 树 : 每 一 次 从 当前 的 满 二 又 树 中 (初始 时 ,每 一 个 
字符 构成 一 棵 平凡 的 二 又 树 , 共 及 n 棵 ) 选 择 两 棵 频数 最 小 的 构造 成 一 棵 新 的 满 二 又 树 。 由 
于 每 做 一 次 这 样 的 操作 ,就 会 减少 一 棵 树 ,所 以 n — 1 次 操作 后 将 构成 唯一 的 一 棵 满 二 又 树 。 
定理 9-2 告诉 我 们 ,本 问题 具有 贪 禁 选 择 性 质 。 

定理 9-22. VE C 为 一 个 字母 表 , 其 中 的 每 一 个 字符 CCC 具有 频数 fc]. Wt x Hy EC 
中 的 两 个 频数 最 小 的 字符 。 则 

CD 存在 C 的 一 棵 最 优 前 级 码 树 工 ,在 此 编码 树 中 二 和 yy 是 兄弟 叶子 。 

(2) t C 是 在 C 中 移 除 字符 x y 并 加 入 新 的 字符 = 的 字母 表 , 所 以 C —C— {x.y} Utz} 
定义 C' 中 的 除了 f[z]=f[z]J 十 f[yj 外 ,其 余 的 和 在 C 中 的 一 样 。 设 并 为 任 一 棵 表示 C 
的 一 个 最 优 前 级 码 的 树 。 则 在 树 TT 中 将 叶子 < 替换 为 以 x 为 左 孩 子 、y 为 右 孩 子 的 一 个 内 


二 又 树 2 ,所 以 可 构造 以 C 中 字符 为 叶子 的 Tc Jia cim 对 应 一 个 


Q 本 书 所 说 的 满 二 叉 树 , 指 的 是 树 中 每 个 内 点 均 有 两 个 孩子 的 二 叉 树 。 
© 见 第 3 章 中 的 脚注 1。 
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点 得 到 的 树 T 为 表示 字母 表 C 的 一 个 最 优 前 绥 码 的 树 。 

本 定理 结论 (1) 证 明 的 思想 是 取 一 棵 表示 任意 最 优 前 绥 码 的 树 工 ,修改 此 树 使 之 成 为 表 
示 另 一 个 最 优 前 缀 码 的 树 ,在 这 棵 新 树 中 xz 和 y 为 两 片 具有 最 大 深度 的 兄弟 叶子 。 

设 a 和 2 为 工 中 具有 最 大 深度 的 两 片 兄 弟 叶子 。 由 于 flo lA f[Lyj 是 两 个 最 小 的 频数 ， 
而 fla Vf (LOE PME SK WA f Le T fLa]B. fy] flO]. 分别 交 换 a RI xc b 和 
y 产生 树 全 。 由 于 每 一 个 交换 并 不 增加 代价 ,所 以 了 “也 是 最 优 的 ,如 图 9-6 所 示 。 


-=--> 


图 9-6 定理 证 明示 例 


而 对 定理 中 的 结论 (2) 而 言 ,首先 从 图 9-7 中 可 见 BCT) Al BCT ZA MN FRR: 
B(T) = BCT’) + flx] + fly] 
或 ,等 价 地 
BO) = BIT) — flx]— fly] 
图 9-7 中 ,TT 是 将 C 的 一 棵 编码 树 工 中 以 z、y 为 孩子 的 内 点 替换 成 新 的 叶子 S.H. 
FE] fUx]9- fly]. Fg C n — BRA ABE. iT T PAH xy WREE T P z 的 深度 多 
一 层 ,因此 有 BITO —-BCD- fEx1— fly]. 


(b) 
图 9-7 编码 树 

用 反 证 法 来 说 明定 理 的 结论 (2)。 假 定 并 不 表示 C 的 一 个 最 优 前 缀 码 。 则 存在 最 优 
编码 树 TY? 满足 B(T”) 二 B(T)。 不 失 一 般 性 (根据 (1)),T" 中 zz 作为 y 的 兄弟 。 设 TY 为 将 
BET PAY x 和 > 的 共同 父母 替换 成 叶子 ,其 频数 为 FLx]=jJLz] 十 FLy]。 于 是 : 

BCT) = BT) — f[x]— fly] < BCT) — fEx]— fly] = BCT’) 

此 与 六 表示 CIN Jc UC SAP. A. To Be a EEE EC — A dic DC n 48 3 

编码 树 。 


4. 算法 的 伪 代 码 描述 
利用 本 问题 的 最 优 子 结构 性 质 和 贪 禁 选择 性 质 , Huffman 发 明了 一 个 创建 称 为 
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Huffman 编码 的 最 优 前 绥 码 的 仿 禁 算法 。 


HUFFMAN(C) 

In<|Cl 

2Q<C 

3 for ix-1 ton—1 

4 do 分 配 新 的 结 点 = 

5 left s ]--x*- DEQUEUE(Q) 
6 right[z] y-- DEQUEUE(Q) 
i parent[ x] parent[ y ]7z 

8 flz]+flz]+ fly] 

9 ENQUEUE(Q,2) 

10 return DEQUEUE(Q) 上 > 返回 树 的 根 


算法 9-5 解决 Huffman 编码 问题 的 算法 


过 程 HUFFMAN 中 的 Q 是 一 个 用 来 存储 子 树 的 优先 队列 ,每 棵 树 的 根 结 点 记录 下 树 中 所 
含 叶子 结 点 的 频数 之 和 作为 优先 级 。 对 于 上 述 的 例子 而 言 ,Huffman 算法 的 运行 如 图 9-8 所 
示 。 因 为 字母 表 中 有 6 个 字符 ,队列 初始 时 大 小 为 6, 建 立 树 需要 5 个 合并 步骤 。 最 终 的 树 表 
示 该 最 优 编码 。 一 个 字符 的 编码 字 是 从 根 到 该 字符 路 径 各 条 边 上 的 标注 的 序列 。 

图 9-8 所 示 为 对 图 9-3 中 给 出 的 频数 Huffman 算法 执行 的 步骤 。 每 一 部 分 展示 了 按 频 
数 递增 排序 的 队列 内 容 。 每 一 步 合 并 两 棵 频数 最 低 的 树 。 内 点 表示 为 圆圈 ,其 中 包含 了 两 
个 孩子 的 频数 之 和 。 连 接 内 点 与 其 孩子 的 边 , 若 连接 的 是 左 孩子 标示 为 0, 若 连接 的 是 右 孩 子 
标示 为 1。 一 个 字母 的 编码 字 是 从 根 到 表示 该 字母 叶子 路 径 上 的 边 的 标识 序列 。 图 9-8(a) 为 
最 初 的 n=6 个 点 的 集合 ,每 个 点 表示 一 个 字母 。 图 9-8(b) 一 图 9-8(e) 为 中 间 步 又 ,图 9-8(f) 为 


$5] Fe Eg [5:13] [16] ES aa [bis] (4 EW 
B 
[#5] [e9] 


(b) 

, e (ane ,网 ss om a 
[s] aba P is I: 
0 

[es] 


(c) (d) 


图 9-8 Huffman 算法 的 执行 步骤 
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最 终 的 树 。 
5. 算法 的 运行 时 间 


根据 第 2 章 中 对 利用 堆 实 现 的 优先 队列 的 分 析 , 第 2 行 创建 最 小 优先 队列 Q FE Om, H 
5 行 和 第 6 行 从 优先 队列 Q IRA BRENT 6(lgz) ,第 8 行 中 将 新 的 树 插入 到 队列 中 耗 
时 B(lgn) ,第 3 一 8 行 的 for 循环 重复 9(z) 次 ,所 以 过 程 HUFFMAN 的 总 耗 时 为 6(nlgn)。 


9.2.2 应 用 一 一 R X. Huffman fj 


Variable Radix Huffman Encoding 


Description 

Huffman encoding is a method of developing an optimal encoding of the symbols in a 
source alphabet using symbols from a target alphabet when the frequencies of each of the 
symbols in the source alphabet are known. Optimal means the average length of an 
encoded message will be minimized. In this problem you are to determine an encoding of 
the first N uppercase letters (the source alphabet. S, through Sy, with frequencies f; 
through fy) into the first R decimal digits (the target alphabet. T, through Tg). 

Consider determining the encoding when R—2. Encoding proceeds in several passes. 
In each pass the two source symbols with the lowest frequencies, say S; and S,, are 
grouped to form a new "combination letter" whose frequency is the sum of fı and fz. If 
there is a tie for the lowest or second lowest frequency, the letter occurring earlier in the 
alphabet is selected. After some number of passes only two letters remain to be combined. 
The letters combined in each pass are assigned one of the symbols from the target 
alphabet. The letter with the lower frequency is assigned the code 0. and the other letter is 
assigned the code 1, (If each letter in a combined group has the same frequency .then 0 is 
assigned to the one earliest in the alphabet. For the purpose of comparisons, the value of a 
"combination letter" is the value of the earliest letter in the combination. ) The final code 
sequence for a source symbol is formed by concatenating the target alphabet symbols 
assigned as each combination letter using the source symbol is formed. The target symbols 
are concatenated in the reverse order that they are assigned so that the first symbol in the 
final code sequence is the last target symbol assigned to a combination letter. The two 


illustrations below demonstrate the process for R—2. 


Symbol Frequency {Symbol Frequency 
A 5 lA 7 
B 7 1B 7 
C 8 Ic 7 


O 见 本 书 第 2 章 2.4 一 2.6 节 。 
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D 15 1D 7 
Pass 1: A and B grouped {Pass 1: A and B grouped 
Pass 2: {A,B} and C grouped | Pass 2: C and D grouped 
Pass 3: {A,B,C} and D grouped {Pass 3: (A.B) and {C.D} grouped 
Resulting codes: A—110.B—111.C— 10. | Resulting codes: A=00,B=01, 
D=0 C=10,D=11 
Avg. length=(3 *5+3%*7+2*8+1%15)/35= |Avg. length-(2* 7--2 * 7 十 2x 7 十 
1.91 2*7)/28—2.00 


When R is larger than 2. R symbols are grouped in each pass. Since each pass effectively 
replaces R letters or combination letters by 1 combination letter. and the last pass must 
combine R letters or combination letters.the source alphabet must contain k * (R— 1) +R 
letters. for some integer k. Since N may not be this large. an appropriate number of 
fictitious letters with zero frequencies must be included. These fictitious letters are not to 
be included in the output. In making comparisons, the fictitious letters are later than any 
of the letters in the alphabet. 

Now the basic process of determining the Huffman encoding is the same as for the 
R=2 case. In each pass,the R letters with the lowest frequencies are grouped. forming a 
new combination letter with a frequency equal to the sum of the letters included in the 
group. The letters that were grouped are assigned the target alphabet symbols 0 through 
R—1. 0 is assigned to the letter in the combination with the lowest frequency.1 to the 
next lowest frequency. and so forth. If several of the letters in the group have the same 
frequency,the one earliest in the alphabet is assigned the smaller target symbol. and so 
forth. The illustration below demonstrates the process for R—3. 


Symbol Frequency 


A 5 
B 7 
C 8 
D 15 


Pass 1: ? (fictitious symbol), A and B are grouped 

Pass 2: (?. A. B) .C and D are grouped 

Resulting codes: A—11.B—12.C—0.D—2 

Avg. length—(2*5--2* 7--1* 8 十 1 * 15)/35—1.34 
Input 


The input will contain one or more data sets.one per line. Each data set consists of an 
integer value for R (between 2 and 10) ,an integer value for N (between 2 and 26) ,and the 
integer frequencies f; through fy ,each of which is between 1 and 999, The end of data for 
the entire input is the number 0 for R; it is not considered to be a separate data set. 

Output 


For each data set.display its number (numbering is sequential starting with 1) and the 
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average target symbol length (rounded to two decimal places) on one line. Then display 


the N letters of the source alphabet and the corresponding Huffman codes.one letter and 


code per line. The examples below illustrate the required output format. 


Sample Input 


25510202540 
2542211 
37205851269 
46 10 23 18 25 9 12 


0 


Sample Output 


Set 1; average length 2. 10 


A: 1100 
B: 1101 
C; 111 
D: 10 
E; 0 


Set 2; average length 2. 20 


A: 11 
B: 00 
C: 01 
D: 100 
E; 101 


Set 3; average length 1. 69 


Set 4; average length 1. 32 


A: 32 
1 
0 


: 31 
: 33 


2M D 


1. 问题 描述 与 分 析 
给 定 N 个 字符 S1 、…、Sw 及 其 在 信息 中 出 现 的 频数 fs uer f ,要 求 以 此 计算 信息 按 该 
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字符 集 C 的 最 优 编码 的 存储 量 。 问 题 的 形式 化 描述 如 下 。 
输入 : 字符 集 C= 二 {Si,… ,Sn) 及 每 个 字符 的 频数 f= (fi es fv } TEER, 
输出 : C 的 最 优 R 进 制 编码 下 字符 的 平均 存储 量 ,C 中 各 字符 的 编码 。 
解决 本 问题 的 想法 之 一 是 将 Huffman 算法 扩展 到 R- 叉 树 ,构造 一 棵 尺 又 Huffman 树 


N 

N Ddr) f: 
T JFE T feft BCT) = X drS fi ilti S5 4e 5 REESE GE lC S — M. 

m 2 
Hiis R X. Huffman 树 的 方法 是 : 初始 时 在 NN 个 字符 中 选取 R 个 频数 最 小 的 字符 ,并 按 频 数 
从 小 到 大 (对 频数 相等 的 字符 按 字符 表 顺 序 ) 依次 作为 一 棵 尺 叉 树 的 R 个 孩子 ,将 这 棵 树 视 
为 一 个 组 合 字符 ,其 频数 设置 为 RR 个 孩子 的 频数 之 和 ,追加 到 字符 集中 。 对 新 的 字符 集 (字符 
个 数 比 刚才 少 了 R 一 1) ,用 同样 的 策略 构成 新 的 组 合 字符 .若干 次 这 样 的 操作 ,就 能 得 到 一 
HR X Huffman 树 。 

要 对 N 个 字符 构造 R 又 编 码 树 , 即 构造 一 棵 有 N 片 叶 子 的 满 R SCRI ,可 能 会 遇 到 树叶 
不 够 的 问题 。 例 如 , 题 面 中 字符 集 为 {(A,B,C,D}), 仅 有 N=4 个 字符 ,对 RR 二 3, 最 小 规模 的 
ii 3- 又 树 有 5 片 叶 子 ,就 遇 到 了 这 一 问题 。 为 解决 这 一 问题 , 题 面 给 出 了 一 个 方法 : 若 没有 
整数 A, 使 得 AGR 一 1) 十 R=N, 取 A 一 min{AlAEN 上 且 AGR 一 1) 十 R 三 N) ,此 上 恰 为 构成 R 又 
Huffman 树 的 内 点 个 数 。 令 /二 k(R 一 1) 十 R 一 N ,表示 构成 满 R- 叉 树 缺 少 的 叶子 数 。 在 字 
符 集中 添加 1 个 频数 均 为 0 的 虚拟 字符 ,这 样 对 这 N 十 : 个 字符 组 成 的 字符 集 就 可 以 构造 一 
棵 满 R SOT. 


2. 算法 描述 
将 算法 9-5 RADI IEH OHE R X Huffman 树 ,描述 成 伪 代 码 过 程 如 下 。 


R-HUFFMAN(C, f, N.R) 


1 k+min{k|kEN H k(R—1)+R>N} DAHAR 

2 tk(R—1)+R—N bt 个 虚拟 字符 

3Q-C D3 C HN 个 字符 插入 优先 队列 Q 
4 insert ¢ fictitious letter into Q 

5 for i<-1 tok+1 户 创建 新 的 内 点 

6 do allocate new node z 

7 flz1-—0 

8 for j—-1 to R 上 > 内 点 = 的 尺 个 孩子 

9 do z--DEQUEUE(Q) 

10 z WY childrenLj]-—c DchildrenLj 78 z 8058 j 个 孩子 
11 arent[z]<x 

12 flz]<flz]+ flr] 

13 ENQUEUE(Q. z) 


14 return DEQUEUE(Q) 


算法 9-6 算法 9-3 HIP E, eÆ R X Huffman 树 
与 算法 9-5 相 比 ,算法 9-6 做 了 如 下 几 点 扩展 。 
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CD 48 2 fri E SEE R X Huffman MANA RR HL, MP R=2 的 特殊 情形 的 算法 9-5 
而 言 , 这 是 不 必 的 。 因 为 N 片 叶子 的 满 二 又 树 恰 有 NN 一 1 个 , 即 是 一 个 常数 NN 一 2。 

(2) 第 3 行 和 第 4 行将 1(1 二 k(R 一 1) 十 R 一 N) 个 虚拟 字符 插入 到 优先 队列 Q 中 。 这 在 
算法 9-5 PRAIA. AWAY R=2 时 ,总 有 & 一 N 一 1 使 得 &(R 一 1) 十 R=k 十 2 二 
N 一 2 十 2 二 NN, 这 样 :一 0。 

(3) 第 6 一 12 行 的 for 循环 将 从 Q 中 弹出 的 R 个 结 点 依次 作为 新 的 内 点 < 的 孩子 。 而 
在 算法 9-5 P z RA R=2 个 孩子 。 

利用 过 程 返 回 的 尺 叉 Huffman 树 ,对 树 中 每 一 片 叶子 沿 着 parent 方向 回溯 到 根 ,就 
可 以 计算 出 C 中 每 个 字符 的 编码 ,进而 计算 出 平均 存储 量 。 描 述 成 伪 代 码 过 程 如 下 。 


CALCULATE(T) 

1 cost*-sum--0 

2 for each leaf x in T 

3 do codelx]<-@ 

4 node<-x , p< parent[ node] 

5 while p~NIL 

6 do j~node 作为 p 的 孩子 的 编号 
7 append j to code[z] 

8 node<-p,p*parent[p] 

9 INVERSE(code[ zx]) 

10 cost*-cost-- flax] * length[code[ x ]] 
11 sum*-sum- flax] 


12 return cost/sum 
算法 9-7 RER Huffman 树 计算 字符 编码 及 平均 存储 量 的 过 程 


算法 中 第 2 一 11 行 的 for 循环 对 每 一 个 叶子 结 点 x 进行 处 理 。 第 4 行 设置 2 个 变量 
node Fil p 分 别 跟 踪 当 前 结 点 及 其 父 结 点 。 第 5 一 8 (TI AL HK while 循环 自 底 向 上 逐 层 检测 
当前 的 node 是 其 父 结 点 的 第 几 个 孩子 ,记录 为 j, 追 加 到 x 的 编码 串 code。 这 样 得 到 的 
工 的 编码 是 反 向 的 ,第 9 行 调用 INVERSE 过 程 将 code[zx] 反 转 。 第 10 行 和 第 11 行将 fL] 
+ length[code[ x ] ] RIME] cost P, fr] RIME sum 中 。 算 法 最 终 在 第 12 行将 字符 的 平均 
存储 量 cost / sum 返回 。 


9.2.3 程序 实现 


1. 数据 类 型 定义 


很 容易 想到 用 本 书 第 2 章 中 的 程序 2-12 和 程序 2-13 定义 的 BTreeNode 来 表示 
Huffman 树 。 但 那 是 表示 二 叉 树 的 数据 类 型 ( 它 只 有 左右 两 个 孩子 ) ,用 它 来 表示 R X 
Huffman 树 ( 它 有 RR 个 孩子 ) 显 得 有 点 力不从心 。 此 外 .Huffman 树 一 旦 创建 ,无 须 做 插入 
和 删除 操作 。 出 于 这 些 考虑 ,将 Huffman 树 用 数组 表示 成 静态 R 又 树 , 树 中 每 个 结 点 存储 
为 数组 元 素 , 内 点 的 尺 个 孩子 用 一 个 数组 表示 ,存储 孩子 结 点 的 下 标 , 如 图 9-9 所 示 。 

图 9-9 所 示 为 用 数组 静态 表示 满 尽 又 树 。 图 9-9(a) 是 一 棵 具有 7 片 叶子 的 满 3 又 树 。 
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O 
g @ Q 
00 OOO 


(a) 


(b) 


图 9-9 用 数组 静态 表示 满 尺 又 树 


带 有 阴影 的 表示 叶子 ,白色 结 点 是 内 点 。 图 9-9(b) 是 表示 图 9-9(a) 中 3 叉 树 的 数组 。 数 组 
中 前 7 个 元 素 表 示 树 中 的 叶子 结 点 ,后 面 的 元 素 表 示 内 点 ,连接 结 点 的 弧 线 表 示 父 子 关 系 。 
其 中 ,最 后 一 个 元 素 表 示 树 根 。 


1 typedef struct{ 


2 int ch; 

3 int f; 

4 int parent; 

5 int * child; 

6 — char code[ 16]; 
7 ) Node; 

8 typedef struct { 

9 Node * Nodes; 
10 int N; 

11 int R; 

12 }HTree; 


13 int Compare( Node** a, Node** b){ 


14 
15 
16 
17} 


孩子 数组 的 child 属性 以 及 表示 字符 编码 串 的 code 属性 。 


if(( * a)->f==( * b)->f) 


return (int) (C * b) -»ch) — CinD CC * a)->ch) ; 


return ( * b)->f{—( * a)->f; 


/ * Huffman 树 结 点 类 型 * / 
/* 字 符 */ 

/* 频数 x*/ 

/* 父 结 点 */ 

/* 孩 子 */ 

/ * 编码 串 * / 


/ * Huffman 树 类 型 * / 
/ * 结 点 数组 * / 
/* 叶 子 数 */ 

/ * 基数 */ 


/ * 频数 相等 * / 
/* 比较 字符 * / 
/* 比较 频数 * / 


程序 9-3 表示 二 叉 树 结 点 的 数据 类 型 Node 和 静态 二 又 树 类 型 HTree 
对 程序 9-3 的 说 明 如 下 。 
CD 58 1—7 行 定义 了 表示 Huffman 树 中 结 点 的 数据 类 型 Node。 作 为 结构 体 , 它 有 5 
个 数据 属性 。 表 示 字 符 的 ch 属性 .表示 字符 频数 的 {属性 ,表示 父 结 点 的 parent 属性 ,表示 


(2) 第 8 一 12 行 定义 了 表示 Huffman 树 的 数据 类 型 HTree。 它 有 3 个 数据 属性 。 表 
示 树 中 各 个 结 点 的 数组 属性 Nodes, 表 示 树 中 叶子 结 点 数 的 N 属性 以 及 表示 基数 ( 树 中 每 
个 内 点 具有 的 孩子 数 ) 的 R 属性 。 
(3) 创建 Huffman 树 时 ,由 于 要 将 结 点 加 入 到 一 个 优先 队列 中 ,所 以 需要 定义 比较 两 
个 结 点 大 小 的 函数 。 第 13 一 17 行 定义 的 Compare 就 是 这 样 的 函数 。 该 函数 对 两 个 由 双重 
指针 指引 的 结 点 类 数据 比较 大 小 。 第 14 行 和 第 15 行 对 检测 到 字符 的 频数 相等 情形 按 字 符 


本 身 的 编码 值 决定 大 小 。 第 16 行 对 不 同 的 频数 决定 大 小 。 
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2. 创建 R X. Huffman 树 
接 下 来 实现 算法 9-6. BE R X Huffman fd. 


1 int calckCint r,int n) ( / * 对 给 定 的 r 和 mn 计算 min{k|REN H &£— D rZ] * / 
2 int k=1; 

3 while(k * (r 一 1) 十 r<n)k 十 十 ; 

4 return k; 

5} 


6 HTree Huffman(char * C,int * f,int n.int r){ 
T Hr Tree cTree; 

8 int i,j,k,t'zy 

9 PQueue * Q; 

10 Node *e; 

11 cTree. R=r; cTree. N=n; 


12 k=calck(r,n) ; /*kemin{k|REN H &GÍr— D rZ) k+1 为 内 点 数 * 
13 t=k* (r—1)+r; /*x 叶子 数 * / 

14 Q= initPQueue(sizeof( Node * ) ,t,Compare); / * 创建 优先 队列 * / 

15 cTree. Nodes= (Node * )malloc((t 十 k 十 1) * sizeof( Node)) ; 

16  forG=0;i<n;i++){ /* 初始 化 n 片 字符 叶子 */ 
17 cTree. Nodes[i]. ch=C[i]; 

18 cTree. Nodes[i]. {= fli]; 

19 cTree. Nodes[i]. child= NULL; 

20 memset(cTree. Nodes[i]. code,0,16); 

21 } 

22 for(i=n; i<t; i+ +){ /* 初始 化 虚拟 叶子 结 点 * / 
23 cTree. Nodes[i]. ch=n—t+1; 

24 cTree. Nodes[i]. {=0; 

25 cTree. Nodes[ i]. child= NULL; 

26 ) 

27 for(i=0;i<tsit++)( /* 将 所 有 叶子 加 入 队列 */ 
28 e= & (cTree. Nodes i]) ; 

29 enQueue(Q, &-e) ; 

30 } 

31 for(i—0,z—t;ic =k; i 十 十 ,z 十 十 ){ / * 贪 禁 策 略 创建 Huffman 树 * / 
32 cTree. Nodes[z]. child— (int * ) malloc(r * (sizeof(int) ) ) ; 

33 cTree. Nodes( 2]. {=0; 

34 cTree. Nodes[z]. ch— z4-z; 

35 for(j=0;j<r3j ++) { 

36 Node** x= (Node**) deQueue(Q) ; 

37 int self= * x— cTree. Nodes; 

38 cTree. Nodes[ 2]. f+=( * 3) ^f; 

39 cTree. Nodes[ z . child[ j ]— self; 

40 cTree. Nodes[ self]. parent=z; 

41 } 


/ 
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42 e= &CeTree. Nodes[z]); 
43 enQueue(Q, 8e) ; 
44] 


45 pQueueClr CQ) ; 
46 cTree. Nodes[ —z]. parent —1; 
47 return cTree; 


程序 9-4 实现 算法 9-6 的 C 函数 


对 程序 9-4 的 说 明 如 下 。 

(1) 第 6 一 48 行 定义 的 函数 Huffman, 实 现 算法 9-6 的 过 程 R-HUFFMAN。 与 算法 过 
程 一 样 ,函数 的 4 个 参数 cf、n、r 分 别 表示 字符 集 数组 ,字符 频数 数组 ,字符 个 数 和 基数 。 
函数 返回 表示 该 字符 集 R 进 制 最 优 编码 的 Huffman 树 。 

(2) 函数 中 第 7 行 用 程序 9-3 中 定义 的 R X Huffman 树 类 型 HTree 定义 了 一 个 
Huffman HXT cTree. JH E RNE PMA. 8 9 行 用 本 书 第 3 章 中 程序 3-15 一 程序 3-18 
实现 的 基于 二 又 堆 的 优先 队列 类 型 PQueue 定义 了 一 个 优先 队列 对 象 Q。 第 12 £34 Pw 
数 calck( 定 义 于 第 1 一 5 行 ) 针 对 给 定 的 n 和 计算 用 来 表示 内 点 数 的 k。 第 13 行 计算 表示 
叶子 数 的 t。 第 15 行为 cTree 分 配 了 存储 结 点 的 数组 空间 。 

(3) 第 16 一 30 行 实现 算法 9-4 中 的 第 3 行 和 第 4 行 的 操作 。 其 中 ,第 16 一 21 行 初始 化 
n 片 叶子 结 点 。 第 22 一 26 行 初始 化 t 片 虚拟 的 字符 叶子 (有 的 话 )。 第 27 一 30 行将 所 有 这 
些 叶 子 结 点 加 入 到 优先 队列 Q 中 。 

第 31—44 行 的 for 循环 实现 算法 中 第 5 一 13 行 的 for 循环 。 其 中 ,z 表示 新 的 内 点 (下 
标 ) ,第 32 一 34 行 实现 算法 中 第 6 行 的 操作 。 注 意 , 由 于 内 点 加 入 到 Q 中 需要 与 其 他 结 点 
比较 大 小 ,为 使 得 该 结 点 与 叶子 结 点 频数 相等 情况 下 ,正常 叶子 应 排列 在 前 , 故 第 34 行将 内 
点 z 的 字符 属性 ch 置 为 2 二 z, 它 比 所 有 正常 的 字母 字符 都 要 大 。 当 时 当 275. zH 将 超 
出 127 ,作为 字符 类 型 数据 , 它 会 表示 成 负数 。 所 以 ,为 了 使 结 点 大 小 比较 能 正确 进行 , 程 
序 9-3 中 将 Node 中 的 表示 结 点 字符 属性 的 ch 表示 成 int 类 型 。 

第 35 一 41 行 的 for 循环 对 应 算法 过 程 中 的 第 8 一 12 行 的 for 循环 ,完成 设置 z 的 r 个 孩 
子 的 操作 。 注 意 ,第 37 行将 变量 self 赋予 从 Q 中 弹出 的 结 点 x( 它 是 cTree 的 Nodes 数组 
中 的 一 个 元 素 的 地 址 ) 与 cTree 的 Nodes 属性 的 差 。 这 实际 上 计算 出 x 在 Nodes 数组 中 的 
下 标 。 第 39 行将 此 self 记录 x 作为 z 的 第 j 个 孩子 ,第 40 行 记录 x 的 父 结 点 为 z。 

第 46 行将 根 结 点 的 parent 属性 置 为 一 1 ,与 其 他 结 点 加 以 区 别 。 


3. 计算 字符 编码 及 平均 存储 量 


利用 函数 Huffman 创建 的 RR 叉 Huffman 树 , 可 以 实现 计算 字符 R 进 制 编码 及 平均 存 
储量 的 算法 过 程 。 

1 void inverse (char * s){ 

2 int i=0.j=strlen(s)—1; 

3 whileCi 一 j){ 

4 swap(s 十 i,s 十 j ,sizeofCchar) ) ; 
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5 计 十 j 一 一 ; 


7} 

8 double Calculate HTree T)( 

9 int i,sum=0; 

10 double cost=0. 0; 

11 for(i=0;i<T. N;i++){ 


12 int j, node=i,p=T. Nodes[i]. p,index=0; 

13 while(p! 一 一 1){ 

14 j=0; 

15 while(T. Nodes[p]. child[j]!= node)j+ +; 
16 T. Nodes[i]. code[index+ +]=0'+j; 

17 node=p; 

18 p=T. Nodes[node]. parent; 

19 ) 

20 inverse (T. Nodes[i]. code) ; 

21 cost4- — T. Nodes[i]. f* strlenC T. Nodes[ i]. code) ; 
22 sum+ — T. Nodes[i]. f; 

23 ) 

24 return cost/sum; 

25] 


程序 9-5 实现 算法 9-7 的 C 函数 


对 程序 9-5 的 说 明 如 下 。 

CD 第 8 一 25 行 定义 的 函数 Calculate 实现 算法 9-7 中 的 CALCULATE 过 程 。 与 算 
法 一 样 ,函数 具有 一 个 表示 Huffman 树 的 参数 T, 并 返回 字符 的 平均 存储 量 Cdouble 型 
数据 ) 。 

(2) 函数 中 第 11 一 23 行 的 for 循环 对 应 算法 过 程 中 的 第 2 一 11 行 的 for 循环 ,对 第 i 个 
叶子 结 点 计算 其 编码 串 。 其 中 ,变量 node, p 的 意义 与 算法 中 的 一 致 ,只 不 过 此 处 表示 当前 
结 点 的 下 标 和 当前 结 点 父 结 点 下 标 。 为 跟踪 第 i 个 叶子 结 点 的 编码 串 尾 , 第 12 行 设置 变量 
index, 初 始 化 为 0。 第 13 一 19 行 的 while 循环 对 应 算法 过 程 中 的 第 5 一 8 行 的 while 循环 ， 
从 自 底 向 上 地 沿 parent 域 计 算 第 i 个 叶子 结 点 的 编码 串 。 其 中 ,第 15 行 的 while 循环 在 p 
的 孩子 数组 child 中 ,寻找 node 的 下 标 j ,实现 算法 中 的 第 7 行 操作 。 第 16 行将 j 追加 到 第 i 
个 叶子 结 点 的 编码 串 尾 codeLindex]。 由 于 在 程序 9-4 的 第 20 行将 code 数组 中 的 每 个 元 素 
初始 化 为 0( 也 就 是 字符 A0) , 故 在 第 13 一 19 行 的 while 循环 完成 后 无 须 再 对 code ff] A FÉ Us 
加 NO 了 。 

(3) 第 20 行 调用 函数 inverse 将 第 i 个 结 点 的 编码 串 反 转 。 该 函数 定义 于 第 1 一 7 行 。 


4. 主 函 数 


下 列 是 调用 程序 9-4 和 程序 9-5 定义 的 函数 解决 Variable Radix Huffman Encoding 问 
题 的 main 函数 。 


1 int mainO( 
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27 
28 
29 
30 } 


int r.n,count=1; 
FILE * f{1=fopen("chap09/Variable Radix Huffman Encoding/inputdata, txt" ,"r"), 


* {2=fopen("chap09/Variable Radix Huffman Encoding/outputdata. txt" ," w"); 


assert f18.8.(2) ; 
fscanf(f1,"%d%d", &r,&-n); 
while(r) { 


) 


int i, * f; 
char * C; 
HTree T; 
double ave; 
assert(C— (char * ) malloc(n * sizeof(char))) ; 
assert (Í— (int * )malloc(n * sizeof( in )) ; 
for(i—0;icniid- d) 
CLil='A'+is 
fscanf(f1,"%d" ,f+i); 
) 
T=Huffman(C,f,n,r); 
ave=Calculate(T) ; 
ÍprintfCf2, "Set %d; average length %. 2f\n",count,ave) ; 
for(i=0;i<T. N;i+ +) 
fprintf({2,"%c: %s\n",T. Nodes[i]. ch, T. Nodes[i]. code) ; 
fprintf(f2,"\n"); 
free(C) ; free(f) ; 
clrHTreeC &T) ; 
fscanf(f1,"%d%d", &r,&n); 


ÍcloseCf1) ; fcloseCf2) ; 


return 0; 


程序 9-6 解决 Variable Radix Huffman Encoding 的 main 函数 


对 程序 9-6 的 说 明 如 下 。 


COD 第 3 一 5 行 打开 输入 、 输 出 文件 全 和 {2。 第 6 行 在 全 中 读 取 第 一 个 案例 的 基数 r 


和 字符 数 n。 第 7 一 27 行 的 while 循环 处 理 fl 中 的 每 一 个 案例 。 


(2) 第 12 行 和 第 13 行为 本 案例 的 字符 数组 C 和 频数 数组 f 分 配 空间 ,第 14 一 17 行 初 
始 化 第 i 个 字符 C[ 订 并 从 1 中 读 取 该 字符 的 频数 G]. 88 18 行 调用 函数 Huffman 创建 本 
案例 的 Huffman 树 工 ,第 19 行 调用 函数 Calculate 计算 每 个 字符 的 编码 串 及 字符 的 平均 存 
储量 ave。 第 20—23 行 向 文件 £2 写 入 计算 的 结果 。 第 26 行 从 £1 中 读 取 下 一 个 案例 的 基 


数 r+ 和 字符 数 n。 


程序 9-3 和 程序 9-4 存储 在 greedy 文件 夹 中 的 huffman. h 和 huffman. c 中 。 程 序 9-5 和 程 
序 9-6 存 储 为 chap09/ Variable Radix Huffman Encoding 文件 夹 中 的 文件 VariableRadixHuffma- 


nEncoding.c 中 。 
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9.3 最 小 生成 树 


9.3.1 算法 描述 与 分 析 


1. 问题 的 理解 与 描述 


设 G==<V,E 二 是 一 个 无 向 连通 图 ,n 个 顶点 用 前 n 个 正 整 数 编号 , 即 V={1,2,…,n})。 
G 具 有 权 函 数 w: E>R, 目标 是 找到 G 的 一 棵 生成 树 2 工 ,使 得 其 权 w(T) 一 一 树 中 每 条 
边 的 权 之 和 一 一 最 小 。 本 问题 可 以 形式 化 为 如 下 。 

输入 : 图 G=<V,E> RIKK w: E—R. 

输出 : G 的 一 棵 生成 树 工 ,使 得 w(T) 最 小 。 


2. 最 优 子 结构 


这 是 一 个 组 合 优化 问题 ,G 有 若干 棵 生成 树 ,每 棵 生成 树 醋 均 有 其 权 值 w(T) 作 为 目标 
值 。 目 的 是 求 得 具有 最 小 目标 值 的 生成 树 。 这 个 问题 的 最 优 子 结构 阐述 如 下 。 

设 工 是 G 的 一 棵 最 小 生成 树 ,e 是 工 中 一 条 边 , 删 去 e 则 将 工分 成 两 部 分 Ti AT 
假定 Vi 和 V 分 别 是 T RIT, 所 包含 的 顶点 集 ,'G, A G 分 别 是 G 的 V, AV, 诱导 的 子 
图 @, 则 T 和 T; 分 别 是 G A G 的 最 小 生成 树 。 


3. RARE 


本 问题 的 贪 禁 选 择 性 质 可 以 阐述 如 下 。 

定理 9-3. WE G— -—V,.E- JE — T CIS d ALAR RK w: E>R,U 是 V 的 一 个 真子 
4i. NJ 

(1) 在 集合 {(z,y)|(z,y)EE,zEUyEV 一 U} 中 
找 出 权 值 最 小 者 , 记 为 (u.v)。 则 (u,v) 必 在 G 的 一 棵 最 
小 生成 树 中 。 

(2) Gid GEG 中 由 UU 诱导 的 子 图 ,T 是 G' 的 最 小 
生成 树 , 则 把 (1) 中 选择 的 边 (x,v) 添 加 到 T 中 将 构成 G 
的 由 UU {v} 诱 导 的 子 图 的 最 小 生成 树 。 

本 定理 (1) 的 正确 性 可 说 明 如 下 。 若 否 , 设 (uv) 不 
在 G 的 任 一 最 小 生成 树 中 。 设 T HG 之 一 最 小 生成 树 ， 
将 (u,v) 添 加 到 工 中 必 在 其 中 形成 一 条 包含 (u,v) 的 圈 p ”图 9-10 定理 9-3 的 证 明 思 路 
( 见 图 9-10)。 在 此 p 中 ,至 少 存在 一 条 边 (z.y), 使 得 


QR 表示 实 数 集合 。 

[^] G 的 生成 树 指 的 是 G 的 一 个 连接 G 的 所 有 顶点 的 连通 子 图 ,其 中 没有 圈 。 

© X V'CVHE'CE.H G'— WV’, E') 是 G=(V,E) 的 一 个 子 图 。 给 定 一 个 集合 V'SV,G 的 一 个 由 V' 诱 导 的 子 
图 是 子 图 G' = (V', E), Hp E= {(u, VEE :u,vEV'}。 
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zEU,yEV 一 U( 否 则 不 会 形成 一 个 圈 ) 。 在 此 圈 中 删除 (z,y) 将 得 到 一 棵 生成 树 TT" 5j 
T 相 比 仅仅 只 有 一 条 边 (z,y) 与 (x,z) 不 同 。 于 是 wT — we (OD) — wo G y) T wGis v) — 
wT) KET AG 之 一 最 小 生成 树 矛 盾 。 

对 本 定理 的 (2) ,首先 说 明 TU ({ (u,v)} 仍 然 构成 一 棵 根 树 。 这 是 因为 EU, 而 v&U， 
因此 中 各 顶点 通过 w 可 达 v, 且 (u,v) 不 会 与 工 中 的 边 构成 圈 。 所 以 ,TU1{ (u,v)) 是 一 棵 
树 。 其 次 ,根据 (1) 中 (u,v) 的 选取 可 知 TU{(u,v)} 是 G 的 由 UU {v) 诱 导 的 子 图 中 权 值 最 
小 的 生成 树 。 


4. 算法 的 伪 代 码 描述 


根据 最 优 子 结构 特性 和 贪 禁 选择 性 质 ,可 以 用 如 下 的 贪 禁 选 择 策略 ,来 解决 构造 权 函 数 
为 也 的 图 G 的 以 > 为 根 的 最 小 生成 树 问 题 。 

从 U— (r)3E f HE (Ge 30 | Gr 32 € E-Z€ U. y€ V CU PRE H Cu v) ,将 
(u,v) MAB) T Pv MAB UP, TEE Prim 算法 。 算 法 的 运行 如 图 9-11 所 示 。 


图 9-11 构造 带 权 图 的 最 小 生成 树 的 Prim 方法 
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MST-PRIM(G,w,r) 

1U<{r} 

2 T—(5 

3 QV- {r} 

4 while QC 

5 do (u,v) 集合 {(z,y)|1(z,y)EE,zEU,yEQ} 中 权 值 最 小 的 边 
6 T-—TU (Cu) 

¢ U<UU (v) 

8 Q-Q- (v) 

9 return T 


算法 9-8 解决 最 小 生成 树 问题 的 Prim 算法 
5. 算法 的 正确 性 


算法 中 第 4 一 8 行 的 while 循环 具有 如 下 的 循环 不 变量 : 每 次 重复 之 初 , 边 集 了 构成 G 
的 由 U 诱 导 的 子 图 的 最 小 生成 树 , 且 Q 中 保存 的 是 顶点 集 V 一 U。 

利用 此 循环 不 变量 ,可 以 证 明 算 法 的 正确 性 。 

对 U 中 元 素 个 数 |U| (该 循环 每 重复 一 次 ,U 中 元 素 恰 增加 一 个 ) 进 行 数学 归纳 。 初 始 时 ， 
由 第 1 行 可 见 U 为 单元 素 集 {r} ,IU| 二 1。 由 于 G 中 由 器 诱 导 的 子 图 是 平凡 的 ,其 生成 树 必 为 
空 。 所 以 第 2 行将 工 初始 化 为 空 集 符合 上 述 不 变量 。 注 意 第 3 行 Q 初 始 化 为 V 一 U。 

假定 |U| — i 时 本 次 循环 重复 之 初 ,不 变量 为 真 , 即 边 集 工 构成 G 的 由 UU 诱导 的 子 图 的 
最 小 生成 树 , 且 Q==V 一 U。 在 本 次 重复 中 ,第 5 行 选取 {(z, y), y) E rU, yQ PI 
值 最 小 的 边 为 (u,v)。 第 6 行将 (u, wv) 添加 到 工 中 ,第 7 行将 wv 添加 到 U 中 ,第 8 行 通过 从 
其 中 删除 将 Q 调整 为 V 一 U。 根据 定理 9-3 将 (u,v) 添 加 到 工 中 将 构成 G 的 由 
U({v)} 诱 导 的 子 图 的 最 小 生成 树 。 此 状态 将 维持 到 下 一 次 重复 之 初 。 即 1U|=i 十 1 时 的 重 
复 之 初 ,不 变量 依然 为 真 。 

循环 终止 时 ,Q 为 空 集 ,U 为 V, 根 据 循环 不 变量 知人 是 G 中 由 U(=V) 诱 导 的 子 
图 一 一 此 时 就 是 G 的 最 小 生成 树 。 

上 述 过 程 的 实现 难点 在 于 第 5 行 从 集合 {(z,y)|(z,y)EE,rEU,yEQ}) 中 选取 权 值 
最 小 的 边 。 为 每 个 顶点 u 增添 两 个 属性 : 属性 key[uj 记 录 该 项 点 处 于 QCQ=YV 一 D) 中 时 
与 U 中 顶点 构成 的 边 中 的 最 小 权 值 ,属性 x 记录 该 顶点 处 于 Q 中 时 与 U 中 构成 最 小 权 值 
边 的 另 一 个 顶点 ,也 就 是 在 最 小 生成 树 中 的 父 结 点 。 同 时 将 Q 改造 成 一 个 最 小 优先 队列 ,Q 
中 顶点 以 key 作为 其 优先 级 。 初 始 时 ,所 有 顶点 的 x 属性 指向 空 ,Q 置 为 V,key[ 门 为 0, 其 
余 顶 点 的 key RAVER BAH. HUM Q 中 出 队 的 顶点 u 为 key 属性 最 小 的 顶点 (第 一 个 出 
队 的 为 ro ,以 此 保证 所 选 的 是 U 与 Q 之 间 权 值 最 小 的 边 。 扫 描 Q 中 与 x 相 邻 的 所 有 项 点 ， 
调整 这 些 顶 点 key 和 Fr 属性。 只 要 重复 nn 次 上 述 操 作 就 构造 了 G 的 一 棵 以 ~ 为 根 的 最 小 生 
成 树 。 由 于 x 属性 跟踪 了 生成 树 中 结 点 的 父子 关系 ,所 以 省 略 了 集合 T. key 属性 跟踪 了 
Q 中 顶点 目前 与 U 中 顶点 构成 边 的 最 小 权 值 ,所 以 U 也 可 省 略 。 细 化 后 的 代码 如 下 。 

MST-PRIM(G,w,r) 

1 for each uE VLG] 

2 do key[u]-—75 
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3 xlu]<NIL 

4 key[ 门 <-0 

5 Q-—V[G] 

6 while Q7 Ø 

7 do u--DEQUEUE(Q) 

8 for 每 个 与 u 相 邻 的 顶点 v 


9 do if vEQ 有 wlu,v) key Lv] 
10 then z[v]-—4 

11 keyLv]*7wG v) 
12 FIX(Q) 


13 return key and x 


算法 9-9 Prim 算法 的 细 化 


本 算法 中 的 优先 队列 Q 的 使 用 与 HUFFMAN 算法 中 的 不 同 。 在 那里 ,元 素 从 进入 队列 
到 离开 队列 ,其 键 值 不 会 发 生变 化 。 而 在 此 处 ,第 11 行 的 操作 是 对 留 驻 在 队列 Q 中 的 元 素 
的 键 值 进行 改写 。 这 样 ,每 当 第 8 一 11 行 的 for 循环 重复 一 次 ,就 可 能 破坏 队列 Q 的 堆 性 
质 , 所 以 在 第 12 行 要 对 Q 做 一 次 堆 性 质 的 维护 操作 FIXCQD 。 

一 般 说 来 ,一 个 图 的 最 小 生成 树 不 必 是 唯一 的 。 当 队列 中 键 值 最 小 的 元 素 不 止 一 个 时 ， 
不 同 的 队 首 将 使 第 7 行 的 出 队 操 作 得 到 不 同 的 顶点 ,这 可 能 导致 不 同 的 生成 树 。 但 是 所 有 
的 最 小 生成 树 都 具有 相同 的 权 值 。 

跟 算 法 9-8 相 比 ,由 于 省 略 了 边 集 T( 最 终 形成 G 的 最 小 生成 树 ), 所 以 第 13 行 返回 的 


6. 算法 的 运行 时 间 


粗略 地 看 ,算法 MST-PRIM 的 第 1 一 3 行 耗 时 OO) ,第 5 行 创建 优先 队列 耗 时 OC) ,第 
6 一 12 行 的 while 循环 重复 次 ,每 次 重复 中 第 8 一 11 行 的 for 循环 耗 时 8(n)。 第 12 行 对 
优先 队列 的 维护 (相当 于 重建 二 又 堆 ) 耗 时 OC) ,所 以 该 算法 的 总 耗 时 为 O) 。 


9.3.2 程序 实现 


1. 数据 准备 


如 上 所 述 ,应 当 改造 优先 队列 PQueue. 使 其 能 够 对 经 过 改写 了 队列 中 元 素 键 值 后 的 队 
列 维 护 堆 性 质 。 实 际 上 只 要 在 第 3 章 创 建 的 程序 文件 pqueue. c 加 入 以 下 的 内 容 , 并 将 所 定 
义 的 函数 fix 的 原型 声明 加 入 到 pqueue. h 中 就 可 以 了 。 


1 void fix(PQueue * q){ 
2 buildHeap(q->heap,q—>eleSize,q->heapSize,q->compare) ; 
3} 


函数 fix 调用 buildHeap ,按照 队列 q 的 元 素 大 小 比较 规则 compare 重新 将 q 创建 成 一 
个 堆 。 
由 于 插入 队列 中 的 元 素 是 指向 key 数组 元 素 的 指针 ,所 以 不 能 直接 引用 先前 定义 过 关 
于 double 型 数据 的 比较 规则 ,需要 定义 一 个 能 通过 双重 指针 比较 double 型 数据 的 函数 : 
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1 int dblLess(double **x,double **y) { 
2 if((**#x) Gy) 

3 return 1; 

4 if((#*x) > (xxy)) 

5 return — 1; 

6 

7 


) 
程序 9-7 ”比较 优先 队列 中 double 型 指针 元 素 指向 的 数据 大 小 的 函数 


把 函数 定义 存储 在 Utility 目录 的 头 文件 compare. c 中 ,以 备 重用 。 
此 外 ,还 需要 考虑 如 何 表示 一 个 图 。 与 第 8 章 中 8. 4 节 表 示 带 权 有 向 图 相似 ,对 于 一 个 
带 权 无 向 图 G— —V ,E>, 权 函数 ww: E>R, 通 常用 G 的 权 矩 阵 W Cw ),x, 来 表示 。 其 中 
wD) DEE 
we lo GpeE 
同样 ,为 便于 作为 参数 传递 ,用 一 维 数组 按 行 优先 规则 来 表示 一 个 二 维 数组 ,用 以 表示 一 个 
带 权 图 。 为 方便 计 , 在 程序 中 把 图 中 的 个 顶点 表示 为 V 二 10,1,…,n 一 1) ,这 样 就 和 key 
等 数组 的 下 标 统一 起 来 了 。 


2. 实现 函数 
利用 上 述 的 数据 准备 ,将 算法 9-9 实现 为 如 下 C 函数 。 


1 pair mstPrim(double * w,int n,int r){ 

2 int * pi= (int * ) malloc(n * sizeof Cint) ) . 

3 * poped= (int * ) malloc(n * sizeof (int) ) , 

4 iuyv; 

5 double * key— (double * )malloc(n * sizeof(double) ) ; 
6 PQueue * Q= initPQueue(sizeof( double * ),n,dblLess) ; 
党 for(i=0;i<n;i++){ 

8 keyli]=DBL_MAX; 

9 pili]=—1; 

10 poped[i]—0; 

1 ) 

12 key[r]=0. 0; 

13 for(i=Osi<nsit+){ 


14 double * e; 

15 e— &key[ i]; 

16 enQueue(Q, 8e) ; 

12 3 

18 while(!empty(Q)){ 

19 u—( * (double**) deQueue(Q) ) — key; 
20 poped[u]—1; 

21 for(v=0;v<n;v++){ 

22 if(wlu * n+v]>0. 0) 

23 if(poped[ v] 
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24 if(wLu * n+v]<key[v]){ 
25 pi[v]=u; 
26 key[v]=w[u * n+v]; 


28 ) 

29 fix QD; 

30 j 

31  pQueueClr(Q) ; 

32 return make_pair(key, pi); 


程序 9-8 ”实现 算法 9-9 的 C 源 代码 


对 程序 9-8 的 说 明 如 下 。 

(1) 函数 mstPrim 除了 表示 图 G 的 数组 w 和 作为 根 的 顶点 编号 r 两 个 参数 外 ,还 有 一 
个 表示 图 的 顶点 数 n 的 参数 。 返 回 值 类 型 是 8. 3. 3 节 中 开发 的 数据 类 型 pair, 其 中 封装 了 
计算 所 得 的 数组 key 和 pi。 

(2) 第 2 行 和 第 3 行 声 明了 两 个 整 型 数组 : pi( 对 应 于 过 程 MST-PRIM 中 的 x) 和 用 来 
跟踪 顶点 是 否 在 队列 中 poped。 第 5 行 声明 了 跟踪 各 顶点 的 key 属性 的 数组 key。 第 7 一 11 
行 的 for 循环 完成 对 这 3 个 数组 的 初始 化 工作 。 第 12 行将 根 结 点 e 的 key 值 置 为 0, 作 为 
优先 队列 的 首 元 素 。 所 有 这 些 代码 实现 MST-PRIM 过 程 中 的 第 1 一 4 行 的 操作 。 第 6 行 声 
明了 PQueue 类 型 的 指针 对 象 Q, 并 对 其 进行 了 初始 化 ,将 程序 9-8 定义 的 函数 dblLess ff 
为 优先 队列 中 元 素 大 小 比较 规则 。 

(3) 第 13 一 17 行 代码 实现 MST-PRIM 过 程 中 第 5 行 的 建立 优先 队列 操作 Q-—V[G ]. 
要 注意 的 是 ,由 于 加 入 到 队列 Q 中 的 是 指向 数组 key 的 元 素 的 指针 , 若 省 掉 第 14 行 和 第 15 
行 ,直接 调用 enQueue(Q, &-keyLi]) , 则 按照 第 3 章程 序 3-17 的 解析 ,执行 的 结果 是 将 S key[1] 
指向 的 keyli MAB Q 中 ,而 不 是 把 &&key[ 训 加 入 进去 。 所 以 需要 有 一 个 存储 S key i 10g 
变量 e 来 做 中 转 , 这 就 是 第 14 一 15 行 的 工作 。 

(4) 第 18 一 30 的 代码 实现 MST-PRIM 过 程 中 第 6 一 12 行 的 操作 。 其 中 ,第 19 行 调用 
函数 deQueue 将 Q 的 队 首 元 素 出 队 ,解析 出 其 中 存储 的 指向 数组 key 的 元 素 的 地 址 ,与 key 
的 首 地 址 之 差 , 恰 好 是 该 元 素 在 key 中 的 下 标 值 ,赋值 给 表示 图 中 对 应 顶点 的 u。 第 20 行 
将 出 队 的 顶点 u 做 出 队 标志 (poped[u] 置 为 D ,这 个 标志 是 第 23 行 所 要 检测 的 。 

此 外 ,请 注意 第 22 行 ,第 24 行 和 第 26 行 对 由 参数 传递 进来 的 数组 w 的 元 素 w[u * ntv] 
的 访问 相当 于 若 w 是 一 个 二 维 数组 对 元 素 wLuj[vj 的 访问 。 

(5) 第 38 行将 计算 所 得 的 数组 key 和 pi 封装 到 pair 对 象 中 ,并 将 其 返回 。 

为 便于 代码 重用 ,将 程序 9-8 中 的 函数 定义 存储 在 greedy 文件 夹 中 的 源 文件 prim. c 
中 ,而 将 该 函数 的 原型 声明 存储 于 头 文件 prim. h 中 。 


9.3.3 应 用 一 一 北方 通信 网 


Arctic Network 
The Department of National Defence (DND) wishes to connect several northern 
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outposts by a wireless network. Two different communication technologies are to be used 
in establishing the network: every outpost will have a radio transceiver and some outposts 
will in addition have a satellite channel. 

Any two outposts with a satellite channel can communicate via the satellite, regardless 
of their location. Otherwise,two outposts can communicate by radio only if the distance 
between them does not exceed D. which depends of the power of the transceivers. Higher 
power yields higher D but costs more. Due to purchasing and maintenance considerations. 
the transceivers at the outposts must be identical; that is. the value of D is the same for 
every pair of outposts. 

Your job is to determine the minimum D required for the transceivers. There must be 
at least one communication path (direct or indirect) between every pair of outposts. 

The first line of input contains N.the number of test cases. The first line of each test 
case contains 1<S<100,the number of satellite channels,and S< P500, the number of 
outposts. P lines follow.giving the (x,y) coordinates of each outpost in km (coordinates 
are integers between 0 and 10.000). For each case. output should consist of a single line 
giving the minimum D required to connect the network. Output should be specified to 2 
decimal points. 

Sample Input 

1 

24 

0 100 

0 300 

0 600 

150 750 


Sample Output 


212.13 


l. 问题 描述 与 分 析 


要 将 北方 各 哨所 用 两 种 无 线 技术 实现 通信 连接 。P 个 哨所 (每 个 哨所 都 用 坐标 标识 ) 中 
有 S 个 可 以 使 用 卫星 通信 ,卫星 通信 不 受 地 理 位 置 的 限制 。P 个 哨所 中 的 每 一 个 都 有 无 线 
收发 机 用 来 与 其 他 哨所 联系 ,但 无 线 电 通信 受 接收 器 功率 的 影响 : 功率 越 大 ,通信 覆盖 半径 
DD 越 大 ,当然 代价 也 越 大 。 为 方便 维护 与 管理 .要 用 统一 型 号 的 无 线 收 发 机 配置 各 哨所 。 
要 使 任意 两 个 哨所 之 间 能 进行 直接 或 间接 的 通信 ,并 使 得 装备 费用 最 低 。 问 题 可 形式 化 为 
如 下 。 

输入 : 已 个 哨所 的 坐标 : A={(z,y),…,(Czp,yp)}。 可 以 使 用 卫星 通信 的 哨所 数 S. 

输出 : 连接 所 有 哨所 的 通信 网 络 中 所 配备 无 线 收发 器 的 最 小 覆盖 半径 D. 

将 每 个 哨所 视 为 图 中 一 个 顶点 ,哨所 间 的 距离 作为 两 顶点 间 边 的 权 值 。 这 样 将 得 到 一 
个 具有 P 个 顶点 的 带 权 完全 图 。 作 为 连接 所 有 哨所 的 最 节省 通信 网 应 当 是 该 完全 图 的 最 
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小 生成 树 。 但 还 需要 考虑 在 最 小 生成 树 中 有 S 个 顶点 可 以 用 卫星 频道 相互 通信 ,这 样 ,就 
可 以 在 最 小 生成 树 中 对 最 长 的 若干 条 边 的 端点 配置 卫星 通信 , 剩 下 的 边 中 最 长 者 就 是 这 棵 
生成 树 对 应 的 配备 方案 的 无 线 收发 机 的 最 小 代价 D T 

2. 算法 描述 


首先 需要 将 案例 中 PP 个 哨所 坐标 转换 成 一 个 带 权 无 向 图 。 假 定 哨 所 坐标 表示 成 了 两 
个 数组 x[1..Pj、y[L1..Pj, 可 用 下 列 过 程 转换 成 一 个 无 向 带 全 图 的 权 和 矩阵 w[1..P,1..Pj]。 


MAKE-GRAPH(r, y, P) 
1 for i-—1 to P 
2 do for j--1 to i 


3 do w[i,j]-wj.i]— V GÜi]— a0 D + GUI- 5D 


4 return w 


算法 9-10 将 P 个 哨所 的 坐标 转换 成 一 个 无 向 带 全 图 
对 表示 图 G 的 权 和 矩阵 z 计算 最 小 的 无 线 传输 距离 D 的 过 程 表示 为 如 下 的 伪 代 码 。 


ARTIC-NETWORK(w,S) 
T<MST-PRIM(w 1) 
neS 
Q--T FA xs 
while n>1 
do (4:9) *- DEQUEUE( Q? 
让 x 未 访问 过 
then n<-n—1 
这 vw 未 访问 过 
then n<-n—1 


co 0 -3 0 0 & o tw 2 


10 if »—0 
11 then (u,v)<-DEQUEUE(Q) 
11 return w[u,v] 


b T AVA 1 为 根 的 最 小 生成 树 


PQ 为 一 最 大 优先 队列 
配置 卫星 频道 


上 无线 收发 机 覆盖 半径 


算法 9-11 计算 无 线 电 最 小 传输 距离 的 过 程 


3. 程序 实现 


1 # include "../../datastructure/pqueue. h" 
2 # include ".. 
3 double * w; 


./greedy/prim. h" 


4 int * pi; 

5 int p; 

6 int s; 

7 int compare(const int **a, const int **b) { 
8 int u—**a,v— * a— pi, 

9 x=**b,y= * b— pi; 

10 if(wLu * pt-v]7 wx * pt- y D 

11 return 1; 


/* 图 的 权 和 矩阵 * / 

/ * 最 小 生成 树 * / 

/x* 哨所 数 * / 

/* 安 装 卫星 通信 机 的 哨所 数 / 
/* 最 小 生成 树 中 边 的 大 小 比较 * / 
/ * (uv) 为 由 a 确定 的 边 * / 

/ * (xy) Jh b 确定 的 边 */ 

/ * Gu HE GG y)  / 


第 9 章 贪 禁 策略 
12 if(wlu* ptv]<wlx* pty]) / * Gu HE Gx, yo » / 
13 return —1; 
14 return 0; / * (urv) 和 (xyy) 等 长 */ 
15 } 
16 double * makeGraph(int * x,int * y){ 
17 int isj; 
18 double * w= (double * ) malloc( p * p * sizeof(double) ) ; 
19 forGi=0;i<p;i ++) 
20 forj=0;j<=i;j++) 
21 wLi* p+j]=w[j * p+i]=sqrt( (double) Cx[i] — xj) * GLi]— xDD 4- 
GLi]—yG» * liJ- LI; 
22 return w; 
23 } 
24 double ArcticNetwork(double * w,int p,int s)( 
25 PQueue * Q=initPQueue(sizeof(int**) , p— 1 compare) ; 
26 int * e,i,n—s, * visited— (int * )calloc( p.sizeofCint) ) ,u,v; 
27 double d; 
28 pair t=mstPrim(w,p,0); 
29 pi= (int * ) (t, second) ; 
30 for(i=Osi<psit+){ /< 向 优先 队列 Q 加 入 最 小 生成 树 中 所 有 的 边 */ 
31 if(pi[i]! —— D( 
32 e=pi+i; 
33 enQueue(Q, &e); 
34 ) 
35 ) 
36 while(n>=1){ 
37 v= * ((int**) deQueue(Q)) — pi; 
38 u=pilv]; 
39 if(! visited u]) { 
40 visited u]—1; 
Al mn 一 一 
42 } 
43 if( !visited[v]) ( 
44 visited[v]=1; 
45 mn 一 一 
46 } 
47 ) 
48 ifc t 
49 v= * (Cint**) deQueue( Q0) — pi 
50 u=pilv]; 
51 ) 


52 — d=wlu*ptv]; 

53 pQueueClr(Q) ; free( w) ;free( pi) ; free( visited) ; 
54 return d; 

55 } 
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56 int mainO( 

57 int i.n; 

58 FILE *f1, * f2; 

59 assert(f1— fopen("chap09/ Arctic Network/inputdata. txt" ,"r")); 
60 assert(Í2— fopen("chap09/Arctic Network/outputdata. txt" ,"w")) ; 
61 — fscanf(f1," 26d", &-n); 

62 for(i=0;i<n;it++){ 


63 int j, * x, * y; 

64 fscanf(f1,"%d%d",&-s,&p); 

65 assert(x= (int * ) malloc( p * sizeof(int) )) ; 
66 assert(y= (int * ) malloc(p * sizeof(int) )) ; 
67 for(j=0;j<psj++) 

68 fscanf(f1,"%d%d".x+jsyt+j)s 

69 w-— makeGraph(x. y) ; 

70 fprintfCf2, " 4. 2f\n" , ArcticNetwork(w,p,s)) ; 
71 free(x) ;free(y); 

72 ) 

73 ÍcloseCf1) ; fcloseCf2) ; 

74 return 0; 

75] 


程序 9-9 解决 Arctic Network 问题 的 C 程序 


对 程序 9-9 的 说 明 如 下 。 

COD 第 3 一 6 行 定义 的 变量 w pi pss 分 别 表示 一 个 案例 中 指向 无 向 带 权 图 权 和 矩阵 的 指 
针 , 指 向 调用 mstPrim 以 后 返回 的 最 小 生成 树 中 各 结 点 的 数组 指针 ,哨所 数 和 安装 卫星 通 
信和 器 的 哨所 个 数 。 之 所 以 将 这 些 数 据 定义 成 全 局 变量 ,是 因为 比较 生成 树 中 边 的 大 小 关系 
时 需要 用 到 这 些 数据 ,而 比较 函数 的 原型 又 是 严格 定义 好 的 仅 具 有 2 个 void 型 指针 的 函 
数 。 见 第 7 一 15 行 定义 的 函数 compare。 

(2) 第 16 一 23 行 定义 的 函数 makeGraph 实现 算法 9-10, 将 案例 数据 转换 成 无 向 带 权 
图 的 权 和 矩阵 。 代 码 结构 与 算法 过 程 几乎 一 致 ,读者 可 对 比 阅读 。 第 24 行 和 第 25 行 定义 的 
函数 ArcticNetwork 实现 算法 9-11 ,完成 一 个 案例 的 计算 。 该 函数 维护 一 个 能 存储 p 一 1 个 
元 素 的 优先 队列 ,用 来 存放 图 的 最 小 生成 树 的 所 有 边 。 第 30 一 35 行将 第 28 行 和 第 29 行 调 
用 mstPrim 计算 出 来 的 最 小 生成 树 数组 pi 中 除了 根 以 外 的 所 有 元 素 一 一 加 入 优先 队列 Q 
中 ,完成 算法 中 第 3 行 的 操作 。 注 意 , 由 于 pi 数组 中 的 元 素 pi[ 襄 表示 树 中 边 (pi[ 订 ,iD) 。 其 
KEX wLpLi]-i]. Br EA Q 中 比较 元 素 优 先 级 的 规则 由 第 7 一 15 行 定义 的 函数 compare 确 
定 。 函 数 中 还 维护 了 一 个 用 来 表示 顶点 是 否 已 经 访问 过 的 数组 visited. visiteli ]M (HA 0. 
表示 顶点 i 未 曾 访问 过 , 值 为 1 表示 i 已 经 被 访问 过 。 利 用 表示 安装 卫星 通信 和 器 的 哨所 数 的 
变量 n( 初 始 化 为 s) ,第 36 一 47 的 while 循环 对 应 算法 中 第 4 一 9 行 的 while 循环 反复 从 Q 
中 弹出 若干 条 边 ( 直 至 关联 这 些 边 的 顶点 个 数 小 于 1 为 止 )。 第 54 行将 最 后 从 Q 中 弹出 的 
边 的 长 度 作 为 计算 结果 返回 。 

(3) 第 56—75 行 的 main 函数 在 第 58 一 60 行 打开 输入 、 输 出 文件 所 和 f2。 第 61 行 从 
I1 中 读 取 案例 数 n, 第 62 一 72 行 的 for 循环 处 理 每 一 个 案例 。 其 中 ,第 64 FF 11 中 读 取 本 案 
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例 的 哨所 数 p 和 安装 卫星 通信 器 的 哨所 数 s。 第 67 行 和 第 68 行 读 取 fl 中 的 各 哨所 坐标 数 
据 , 第 69 行 调 用 函数 makeGraph 将 其 转换 成 图 的 权 和 矩阵 w 58 70 行将 调用 ArcticNetwork 
的 返回 值 写 入 f2 中 。 

程序 9-9 存储 于 chap09/ Arctic Network/ 中 的 源 文件 ArcticNetwork. c。 


9.4 单 源 最 短路 径 问 题 


9.4.1 算法 描述 与 分 析 


1. 问题 的 理解 与 描述 


有 向 带 权 图 G— —V E .V—(01,2. n) ECVXV。 其 权 函 数 w: E>R* BE 
到 一 个 非 负 实数 权 值 。 路 径 p= <v ,wy，… ,vi 二 的 权 是 构成 它 的 各 条 边 的 权 之 和 : 


k 
wp) = J wvu) 
i=l 
按 


Sua: min (Cp) :u "ob 车 有 到 w WHE 
ce 否则 
定义 从 uw 到 wv 的 最 短路 径 权 。 于 是 从 顶点 u 到 vw 的 最 短路 径 定 义 为 路 径 p BUB w) = 
6(u,v)。 单 源 最 短 问 题 指 的 是 对 于 图 中 一 个 顶点 ( 源 )sEV, 计 算出 从 s 出 发 到 其 余 每 一 个 
顶点 vEV 一 {s) 的 最 短路 径 及 其 权 值 6(s,v)。 形 式 化 为 如 下 。 
输入 : 有 向 带 权 图 G=<V.E> Jt PARK w: E>R* , 源 顶 点 sEV. 
输出 : 从 s 到 各 顶点 w 的 最 短路 径 及 数组 (6Gs oi ,6(s,v2) ott C840) } o 


2. 最 优 子 结构 


对 于 每 一 个 顶点 vEV 一 {s} 而 言 ,这 是 一 个 组 合 优化 问题 。* 到 o 可 能 有 若干 条 路 径 ， 
每 条 路 径 都 以 各 自 的 权 值 作为 目标 值 。 目 的 是 计算 出 目标 值 最 小 的 路 径 。 单 源 最 短路 径 问 
题 的 最 优 子 结构 性 质 阑 述 如 下 。 

给 定 一 个 带 权 有 向 图 G— (V E) ,其 权 函 数 w: ESR? , 设 p= <u emo > ATUS 
v 到 顶点 v, 的 一 条 最 短路 径 ,对 任意 满足 IIS 的; ju py =< vea ey >H p 
中 从 顶点 v: 到 顶点 v; 的 子路 径 。 则 p; XEM v. Blo, 的 一 条 最 短路 径 。 


3. RBBB 


本 问题 的 贪 禁 选 择 性 质 如 定理 9-4 所 述 。 

定理 9-4 RER SSCV ,SV( 初 始 时 S—OD. 。 对 每 个 vEV 一 S, 维 护 属 性 dq[v]: 从 
源 点 出 发 ,其 间 仅 经 过 S 中 顶点 到 达 w 的 最 短路 径 的 权 ( 初 始 时 d[sj 二 0, 对 v#s.d[v]= 
co), 3E V —S 中 选取 d[uj 最 小 的 项 点 加 入 到 S 中 , 则 au ]—9G o). 

事实 上 ,可 以 对 S 中 的 顶点 个 数 做 归纳 。 当 |S|==0 I.S OV —S 中 从 s 出 发 仅 经 过 
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S 中 顶点 到 达 的 顶点 d 值 最 小 的 就 是 s(d[sj] 二 0, 其 他 的 顶点 v 均 有 d[vj 二 吕 ) 最 短 所 以 将 
有 ss 进入 S。 由 于 6(s,s) 二 0, 所 以 ,此 时 有 d[sj]==6(s,s)。 假 定 |S1=& 一 1 时 ,V 一 S 中 从 s 
出 发 仅 经 过 S 中 顶点 到 达 的 顶点 d 值 最 小 的 是 x, 且 dlul=ds.w). Hie u AVSA 
S 中 ,此 时 ,S 中 的 顶点 都 已 确定 了 从 * 出 发 的 最 短路 径 ,最 短路 径 距 离 就 是 各 自 的 d 值 。 
对 V 一 S 中 只 有 那些 与 相 邻 的 顶点 v Hd 值 可 能 发 生变 化 。 按 如 下 的 方法 修改 这 些 顶 点 
的 d 值 : 

py dlul+wu.v) # dlv]  d[u] - wGo v) 

dv] 否则 
显然 此 时 V 一 S 中 的 顶点 v A s 出 发 仅 经 过 S 中 顶点 
HAWER A dC], | S| =k. EVS 中 选取 d 
值 最 小 的 顶点 w, 下 面 证 明 dL[uj] 二 6(s.u)。 首 先 ,显然 
有 6(s,u) 三 d[uj]。 设 ;到 的 一 条 最 短路 径 为 户 ,从 zx 
起 反 向 在 此 路 径 行进 ,进入 S 前 的 最 后 一 个 顶点 设 为 
yy 的 下 一 个 顶点 设 为 x。 则 p MBs r> 图 9-12 s 到 w 的 最 短路 径 
y u, WA 9-12 所 示 。 


显然 p 的 权 值 为 
9G) = 6(s,y) + po 的 权 值 (最 优 子 结构 ) 
= Ossy) Cp, 的 权 值 > 0) 
= lsz) wr,y) (最 优 子 结构 》 
= d[zx]+w(z,y) (x HES 中 ) 
> d[y] (根据 zx 进入 S IDE a Ly ] 的 调整 ) 
> d[u] (根据 u 的 选择 ) 


于 是 我 们 得 到 6(s,w) 宇 d[u], 连 同 6(s5,w) 三 d[uj, 得 到 d[u]==6(s,u)。 

4. 算法 的 伪 代 码 描述 

利用 这 个 贪 禁 性 质 ,可 以 得 到 一 个 称 为 Dijkstra 算法 .计算 从 s 出 发 到 图 中 各 顶点 的 最 
短路 径 。 

Dijkstra 算法 的 伪 代 码 描述 如 下 。 


DUKSTRA(CG,rzo's) 
1 for each vertex v€ V[G] 
2 do d[ v]--^^ 


3 z[v]--NIL 

4 d[s]--0 

5 Q<V[G] 

6 while QO 

7 do u*-EXTRACT-MINCQ) 

8 for &^- 5j u 相 邻 的 顶点 v 

9 do if d[ v] d[u]--wCu v) 

10 then d[v]<d[u]+w(u,v) 
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11 z[v]-—« 
12 FIx(Q) 
13 return d and x 


算法 9-12 解决 单 源 最 短路 径 问 题 的 DUKSTRA 算法 


按照 本 问题 的 贪 禁 算 法 性 质 , 应 当 维护 一 个 顶点 集合 S, 此 集合 包含 所 有 已 确定 从 s 出 
发 的 最 短 距 离 的 顶点 。 由 于 把 V 一 S 的 顶点 都 存放 于 最 小 优先 队列 Q 中 ,凡是 已 出 队 的 项 
点 ,都 在 S 中 ,所 以 S 可 以 不 显 式 地 加 以 维护 而 被 忽略 。 

算法 对 每 个 顶点 o 维护 两 个 属性 : 表示 从 s BE S 中 的 顶点 到 达 w 的 最 短路 径 的 距离 
d[v] 和 w 在 这 段 最 短路 径 中 的 前 序 顶 点 alol H 1 一 4 行 对 记录 各 顶点 的 这 两 个 属性 的 数 
Ald 和 < 进行 初始 化 。 

第 5 行 是 将 优先 队列 Q 初始 化 为 图 G 的 顶点 集 V。 

第 6 一 12 行 是 按照 仿 禁 选择 性 质 解 决 此 问题 : 每 次 在 V 一 S( 二 Q) 中 选取 d 值 最 小 的 顶 
A u 加 入 到 S 中 (从 Q 中 出 队 ) ,调整 所 有 从 “出 发 且 尚 留 驻 在 V 一 SC 一 Q) 中 的 相 邻 顶点 v 
的 d 值 及 x 值 ,并 维护 Q 的 堆 性 质 。 

算法 运行 于 一 个 有 向 带 权 图 的 实例 如 图 9-13 所 示 。 


(d) ES ES 
图 9-13. 用 Dijkstra 算法 计算 从 * 出 发 到 图 中 各 顶点 的 最 短路 径 的 示例 


5. 算法 的 运行 时 间 


算法 中 第 1 一 3 行 的 for 循环 耗 时 O(n) ,第 6 一 12 行 的 while 循环 重复 8(n) 次 ,每 次 重 
复 第 7 行 的 优先 队列 出 队 操作 耗 时 8(lgn) ,第 8 一 11 行 的 for 循环 耗 时 O(n) ,第 12 行 对 优 
先 队列 进行 堆 性 质 维护 操作 将 耗 时 8(n)。 因 此 ,总 耗 时 O07), 

利用 算法 返回 的 数组 d 和 zx, 可 以 输出 图 中 从 源 顶 点 * 到 其 余 各 顶点 的 最 短路 径 及 其 
距离 。 


PRINT-PATH(z,s.v) 


1 ifv—s 
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2 then print s 

3 else if x[v]= NIL 

4 then print "没有 从 "s" 到 "wv" 的 路 径 " 
5 else PRINT-PATH Goss z[v]) 

6 


print v 


算法 9-13 输出 图 G 中 从 源 项 点 * 到 顶点 v 的 最 短路 径 算法 


该 算法 的 时 间 复 杂 度 显然 是 9(z) 。 因 为 一 条 简单 路 径 至 多 包含 个 不 同 的 顶点 ,所 以 
至 多 递归 调用 次 。 


9.4.2 程序 实现 


根据 对 算法 9-12 的 说 明 ,必须 准备 一 个 数据 结构 : 动态 优先 队列 。 这 件 事情 在 9. 4. 1 
节 中 都 已 做 好 了 ,代码 存储 在 DataStructure 目录 中 的 头 文件 pqueue. h 和 源 文件 pqueue. c 
中 。 插 和 人 到 优先 队列 中 的 元 素 是 指向 数组 d 的 元 素 的 指针 ,所 以 ,必须 有 一 个 通过 两 层 指针 
比较 浮 点 数 的 函数 ,这 在 9. 4. 1 节 也 做 好 了 ,原型 声明 存储 在 Utility 目录 中 的 头 文件 
compare. h 的 函数 dblLess 中 。 


1 # include "../DataStructure/pqueue. h" 

2 # include "../DataStructure/pair. h" 

3 # include "../Utility/compare. h" 

4 pair dijkstra(double * w,int n,int s){ 

5 int * pi= (int * )malloc(n * sizeof (int) ) , 

6 * poped= (int * )malloc(n * sizeof(int)) ,i,u,v; 

7 double * d= (double * )malloc(n * sizeof(double) ) ; 

8 PQueue * Q= initPQueue(sizeof( double * ),n,dblLess) ; 
9 for(i=0;i<n;i+ 十 ){ 


10 pi[i]=—1; 

11 poped[i]=0; 

12 d[i]—DBL MAX; 
13 ) 


14  d[s]-0.0; 
15  forGi=0;i<n;i++){ 


16 double * e; 

17 e— &d[i]; 

18 enQueue(Q, 8e) ; 

19 ) 

20 while(!empty(Q)){ 

21 u=( * (double) deQueue(Q)) — d; 
22 poped[u]—1; 

23 for(v=0;v<n;v++){ 

24 if(! poped[v]) 

25 ifCw[u * nt+v]>0. 0) 

26 if(d[v]>dlu]+wlu* n 十 v]){ 
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27 d[v]=d[u]+w[u * n+v]; 
28 pilv]=u; 


30 ) 

31 fix(Q); 

32 } 

33 pQueueClr(Q); 

34 return make pair(d. pi); 


35] 

36 void printPath(int * pi,int s,int i) ( 
37 ifi==s){ 

38 printfC" id ",i+1); 

39 return; 

40 } 

41 if(pi[i]==—1) 

42 printf("no path from %d to %d\n" ,s+1,i+1); 
43 else{ 

44 printPath(pi,s, pili]) s 

45 printf("%d ",i-- D; 

46 } 

47 } 


程序 9-10 实现 算法 9-12 和 算法 9-13 的 C 源 代码 


对 程序 9-10 的 说 明 如 下 。 

CD 第 4 一 35 行 定义 的 函数 dijkstra 的 3 个 参数 分 别 为 表示 图 的 权 和 矩阵 w( 这 实际 上 已 
经 把 图 的 权 函 数 也 表示 出 来 了 )、 权 矩阵 的 列 数 n、 源 顶点 s。 该 函数 的 返回 值 类 型 是 
8.3.3 节 中 定义 的 pair, 其 中 封装 了 计算 所 得 的 数组 d 和 pi。 

(2) 第 5 一 7 行 声明 了 3 个 数组 : 记录 生成 树 中 每 个 结 点 的 父 结 点 的 数组 pi, 跟 踪 顶 点 
是 否 在 队列 中 的 数组 poped 和 跟踪 各 顶点 的 d 属性 的 数组 d。 第 9 一 13 行 的 for 循环 完成 
对 这 3 个 数组 的 初始 化 工作 。 第 14 行将 源 顶 点 s 的 d 值 置 为 0, 作 为 优先 队列 的 首 元 素 。 
所 有 这 些 代码 实现 DIJKSTRA 过 程 中 的 第 1 一 4 行 的 操作 。 

(3) 第 15 一 19 行 代码 实现 DUKSTRA 过 程 中 第 5 行 的 操作 Q<-VLG]。 要 注意 的 是 ,与 
程序 9-8 的 代码 解析 中 的 说 明 相仿 ,第 16 行 声明 的 变量 e 是 用 来 作为 将 指向 数组 d 的 元 素 
指针 加 入 到 队列 中 的 中 转变 量 的 。 

(4) 第 20 一 32 的 代码 实现 DUKSTRA 过 程 中 第 6 一 12 行 的 操作 。 注 意 第 8 行 对 动态 优 
先 队列 Q 的 初始 化 操作 时 ,传递 在 程序 9-7 中 定义 的 函数 dblLess。 

其 次 ,第 21 行 调用 函数 deQueue 将 Q 的 队 首 元 素 出 队 , 解 析出 其 中 存储 的 指向 数组 d 
的 元 素 的 地 址 ,与 d 的 首 地 址 之 差 , 恰 好 是 该 元 素 在 d 中 的 下 标 值 ,赋值 给 表示 图 中 对 应 顶 
点 的 u。 第 22 行将 出 队 的 顶点 u 做 出 队 标 志 (poped[u] 置 为 D ,这 个 标志 是 第 24 行 所 要 检 
测 的 。 

此 外 ,请 注意 第 25 一 27 行 对 由 参数 传递 进来 的 数组 w 的 元 素 w[u* n 十 vj 的 访问 相当 
于 车 w 是 一 个 二 维 数组 对 元 素 wLuj[Lvj 的 访问 。 第 34 行将 数组 d 和 pi 封装 到 pair 对 象 
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中 ,并 将 其 返回 。 

(5) 第 36 一 47 行 定 义 的 递归 函数 printPath 实现 的 是 算法 9-13, 它 负责 利用 数组 pi 打 
印 出 从 源 顶 点 s 到 顶点 ii 的 最 短路 径 。 代 码 与 算法 的 伪 代 码 几 乎 一 一 对 应 ,此 不 缆 述 。 

为 便于 重用 ,程序 9-10 存储 在 文件 夹 greedy 中 的 源 文件 dijkstra. c 中 ,函数 的 原型 声 
明 存 储 在 头 文件 dijkstra. h 中 。 


9.4.3 应 用 一 一 西 气 东 送 


Pipe Laying Problem 


Description 

The West-to-East natural gas transmission project is another important investment 
project that is next to the Three Gorges Project. In planning The West-to-East natural gas 
transmission project.it started in Xinjiang Tarim Lunnan oil and gas field in the west, 
travel eastward through several large and medium-sized cities , such as Korla, Turpan, 
Shanshan, Hami, Liuyuan, Jiuquan, Zhangye. Wuwei. Lanzhou, Dingxi, Xian, Luoyang, 
Xinyang, Hefei, Nanjing. Changzhou etc.. The termination is Shanghai. It crossed through 
7 provinces or Autonomous regions; they are Gansu, Ningxia, Shanxi, Shanxi, Henan, 
Anhui,and Jiangsu. In this project.a lot of pipelines of gas transmission are needed to be 
laid. Now we assume that the pipe can only be laid with straight line way, and some 
stumbling blocks (such as building etc. ) can't be cut through by the pipeline during the 
process of pipe laying. In other words, if some stumbling blocks are on the straight 
segment which is between any two gas transmission stations, then the pipeline can not be 
laid between the two stations (The error margin is less than 10 5). Moreover. for the 
geology structure is different and other reasons.the budget per unit distance of the pipe 
laying between any two stations is different. The situation of pipe laying as shown in 
Figure 9-14. 


represent station 
[o] p 


o represent stumbling block,coordinate is(1,1) 


represent the pipeline can be laid 


represent the pipeline can not be laid 


图 9-14 管道 铺设 的 障碍 


Please calculate the lowest budget of the pipe laying between two stations. For simplicity. 
the station and the stumbling block are regarded as a point.that is to say.the width of the 
stations and the stumbling blocks is ignored. 


Input 
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The first line of the input is a positive integer T. T is the number of the test cases . 
For each test case.the first line including a single integer N (3<N<100) which indicates 
the number of the stations. Then N lines follow.each has 2 integers separated by blank. 
which represents the x and y (— 5000.7 «5000, — 5000: y «:5000) coordinate of one 
station. After that there's a line including a single integer M (0<M<50) which indicates 
the number of the stumbling blocks. Then M lines follow,each has 2 integers separated by 
space. which represents the x and y (—5000<2<5000, — 5000 y 5000) coordinate of 
one stumbling block. Then 1/2 * N * (N— 1) line followed.each line has one not negative 
real number which indicates the pipeline's budget per unit distance.for example first point 
to second point. first point to third point .**.first point to N point. second point to third 
point.***, N— 1 point to N point. The last line includes two integers which represent input 
serial numbers. 

Note; About the pipeline's budget per unit distance. we don't consider about the 
stumbling block. 

Output 

For each test data. you should print one line include one integer which has been 
rounded. For example: 3. 33 is rounded to integer 3.3. 50 is rounded to integer 4.3. 76 is 
rounded to integer 4.etc. The integer indicates the lowest budget. 


Sample Input 


1 

4 

00 
02 
22 
20 
1 

11 
1.2 
2.5 
3.2 
2.1 
2 

2.7 
24 


Sample Output 


9 
1. 问题 描述 与 分 析 
西 气 东 送 工程 中 有 N 个 气 站 ,由 于 气 站 所 处 地 理 位 置 等 因素 , 气 站 间 铺 设 管道 的 代价 
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各 不 相同 。 假 定 任意 两 气 站 间 的 管道 只 能 沿 直线 铺设 ,上 且 若 连接 两 气 站 的 直线 段 内 存在 障 
碍 物 , 则 不 能 铺设 管道 。 需 要 计算 两 个 指定 气 站 间 最 小 的 管道 铺设 代价 。 问 题 可 形式 化 为 
如 下 。 

输入 : NN 个 气 站 的 坐标 Am Us ey D em Ges ey) M 个 障碍 物 的 坐标 B= (Cat ye 
(zsyw)}, 气 站 间 铺 设 管道 的 单位 代价 p= {pi ,ps，… prxcw-v1) 起 点 气 站 s, 终 点 气 站 4。 

输出 : 从 s 到 1 的 铺设 管道 的 最 小 代价 。 

仔细 阅读 本 题 , N 个 气 站 可 以 视 为 一 个 图 的 N 个 顶点 。 由 顶点 间 铺 设 输油管 道 的 单位 
成 本 和 顶点 间 的 距离 (通过 给 出 的 顶点 的 坐标 计算 可 得 ) 可 计算 出 顶点 间 的 铺设 输油管 道 的 
实际 成 本 ,这 可 以 视 为 图 中 顶点 间 的 边 及 其 权 值 。 这 样 , 本 问题 就 转换 成 在 一 个 无 向 带 权 图 
中 计算 出 从 源 点 (起 点 气 站 ) 到 目标 点 (终点 气 站 ) 的 最 短路 径 。 不 过 这 个 图 需要 从 给 定 的 原 
图 做 必要 的 修改 得 来 : 删 掉 含有 障碍 的 边 。 可 以 如 下 描述 解决 此 问题 的 算法 。 


2. 算法 描述 


PIPE-LAYING(A,B,p,s,t) 

1 w*-MAKR-GRAPH(A, p) 

2 FIX-GRAPH(G, B) Dw BAG 的 权 矩 阵 
3 d-- DIKSTRA(G ,w,5) 

4 return d[:] 


算法 9-14 计算 从 A[s] 到 A[:] 的 最 小 输 油 通 道 费 用 的 过 程 


其 中 ,第 1 行 调用 过 程 将 其 站 坐标 数组 A 和 各 气 站 间 铺 设 有 关 的 费用 数组 p 转换 成 一 
个 无 向 带 权 图 ,返回 该 图 的 权 和 矩阵 w( 元 素 w[u,v] 表 示 直 接 铺设 气 站 v 到 气 站 w 的 输 油 通 
道 所 需 费 用 ) 。 该 过 程 的 伪 代 码 列 为 算法 9-15。 第 2 行 调用 FIX-GRAPH 过 程 ,在 图 中 删 掉 
含有 障碍 (数组 B 中 元 素 ) 的 边 ,得 到 修改 后 的 图 的 权 和 矩阵 w。 该 过 程 的 伪 代 码 列 为 算 
法 9-16。 第 3 行 调用 算法 9-12 的 DYKSTRA 过 程 , 计 算 图 中 从 出 发 所 有 到 可 达 顶 点 的 最 
短路 径 ( 即 从 气 站 s 到 气 站 : 的 最 小 铺设 有 关 费 用 ) ,返回 每 条 最 短路 径 的 长 度 构成 的 数组 
cd。 第 4 行 返回 d[ 门 , 即 * 到 : 的 最 短路 径 长 度 , 亦 为 本 题 所 求 。 

MAKE-GRAPH(A, p) 

1 N--length[A] 

2k-—1 

3 for ux-1 to N—1 

4 do w[u.u]--0 


5 for v--uc-1 to N 

6 do w[u.v]-w[v.u]-- (Alu), A[v]IBI BS 8 E) X p[k] 
7 k-—ktl 

8 return w 


算法 9-315 将 气 站 坐标 数据 转换 成 无 向 带 权 图 


注意 : 数组 p 中 的 元 素 p[1]、p[2]、…、PLN(N 一 1)/2] 表 示 顶 点 1 到 顶点 2, 顶 点 1 到 
顶点 3,…, 顶 点 N 一 1 到 顶点 N 的 铺设 管道 的 单位 费用 。 第 3 一 7 行 的 两 重 嵌 套 的 for 循 
环 , 循 环 体 恰好 重复 N(N 一 1)/2。 由 于 无 向 图 的 权 和 矩阵 是 对 称 的 ,所 以 第 6 行 对 w[u,v] 和 


460 


第 9 章 RER 


w[Lv,uj] 赋 予 相同 的 值 。 


FIX-GRAPH(G,B) 

1 M--Iength[ B] 

2 for i—-1 to M 

3 do for each e€ E[G] 

4 do if B, $T e 

5 then 在 ELG] 中 删除 e 


算法 9-16 在 图 中 删除 含有 障碍 的 边 


注意 : 数组 B 中 元 素 为 障碍 物 坐 标 。 第 2 行 和 第 3 行 的 for 循环 对 每 一 个 障碍 物 B 
[可 ,寻找 图 中 含有 B[ 门 的 边 加 以 删除 。 


3. 程序 实现 


D 构造 无 向 带 权 图 

实现 将 输入 中 的 关于 气 站 坐标 的 数据 转换 成 一 个 无 向 带 权 图 的 过 程 。 
1 double * makeGraph(Point * A,double * p,int n){ 

2 int i,j, k—0; 

3 double * w.d; 

4 assert( w= (double * )calloc(n * n,sizeof( double) )) ; 
5 for(i=0;i<n;i 十 十) 

6 forG=i+1;j<n;j++){ 
[i d—sqrt(CA[i]. x— A[j]. x) * (ALi). x— AG]. x» + CALI]. y— ALjJ. y) * CALiJ. y— A 
L 

8 

9 


wli* n+jJ=wlj *n+i]=d* p[k 十 十 ]; 
) 
10 return w; 


程序 9-11 实现 算法 9-15, 将 坐标 数据 转换 成 无 向 带 权 图 的 函数 


用 本 书 第 5 章程 序 5-1 定义 的 数据 类 型 Point 表示 气 站 坐标 及 障碍 物 坐 标 。 实 现 函数 
的 代码 结构 接近 算法 的 伪 代 码 。 需 要 注意 如 下 两 个 问题 。 

CD 第 7 行 调用 库 函 数 sqrt 计算 点 A[ 口 .ADj] 之 间 的 距离 。 

(2) 用 一 维 数组 按 行 优先 原则 存储 图 的 权 和 矩阵 w。 

2) 修改 图 

对 构造 好 的 无 向 图 ,需要 将 经 过 障碍 的 边 从 中 删除 。 这 可 以 对 每 一 个 障碍 物 BUK 
测 图 中 每 一 条 边 是 否 含有 B[ 站 来 决定 是 否 删除 该 条 边 。 事 实 上 ,并 不 需要 对 图 中 所 有 的 边 做 
RW, Cu.) Bok p EVN AS BRA ur, Yu) VEY) PEY) WALD AA p Dili 
JE minia, sxs} Sr, maxi, «x, ) HLA (u— p) X (p—v) =0. WIESE A 中 的 点 按 x 坐标 的 
3UTHET . xFR— BLE]. te A 中 横 坐 标 大 于 BLE DAY BAB b Eh e iOS bound; ,只 需要 
25 W CAL1]. ALbound; J), +++, CA[1], ALND » CAE2] s ALbound; D» ++, (AL2],ALN])，…， 
CA[bound; —1 ]. AL bound; D » 7. CA[bound; -1]-ALN DAE 4 BLi]. 
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1 int pLess(Point **a, Point **b)( 


2 
3 
4 
5 
6 
7 
8 
9 


10 
11} 


if(( * a)->x>( * b)->x) 
return 1; 

if(( * a)-x«C* b) 30 
return —1; 

if(( * a)->y>( * b)->y) 
return 1; 

if(( * a)->y<( * b)->y) 
return —1; 

return 0; 


12 void fixGraph(double * w,Point * A,Point * B,int n,int m)( 


13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 } 


Point **a; 
int * bounds= (int * )malloc(m * sizeof(int)) ; 
int i,j,index; 
assert(a— (Point**) malloc(n * sizeof( Point * ))) ; 
for(i—-0;icn;id c) 
aliJ=A+i; 
qsort(a,n,sizeof( Point * ) ,pLess) ; 
for(i=0;i<msi++){ 
index=0; 
while( (aL index ]) ->x< B[i]. x) 
index 十 十 ; 
bounds[i]= index; 
) 
for(i=0;i<msit++){ 
int u,v; 
for(u=0;u<bounds[i];u++) 
for(v=bounds[i];v<n;v++) 
ifC!direction(a[u]. &BLiJ,alv])){ 
int p-a[u]— A.q—a[v]— A; 
w[p* n+q]=w[q * nt- p]- DBL MAX; 


) 


ÍreeCa) ifreeCbounds) ; 


程序 9-12 ”实现 算法 9-16, 删 去 图 中 含有 障碍 物 的 边 的 函数 


对 程序 9-12 的 说 明 如 下 。 


COD 第 12 一 36 行 定 义 的 函数 fixGraph 实现 算法 9-16, 删 除 图 中 含有 障碍 物 的 边 。 用 权 
矩阵 w 表示 图 ,但 w[u,v] 虽 然 反 映 了 u 号 气 站 到 v 号 气 站 直接 铺设 管道 的 费用 ,但 并 不 包 
fi uv 的 坐标 信息 。 所 以 ,参数 除了 和 矩阵 w 和 障碍 物 坐标 数组 B 外 ,还 需要 传递 各 顶点 坐 
标 信息 的 数组 A, BBC n 和 m 分 别 表示 顶点 数 ( 气 站 数 ) 和 障碍 物 数 。 

D 为 了 加 快 在 图 中 查找 含有 障碍 物 B[i] 的 边 ,要 对 数组 A 排序 。 然 而 ,矩阵 w 是 按 


462 


第 9 章 RER 


原 A 中 气 站 的 顺序 构造 的 ,一 旦 A 重 排 后 ,要 对 两 个 气 站 对 应 的 一 条 边 反 查 w 中 的 元 素 会 
带 来 困难 。 所 以 第 13 行 ,第 16 行 定义 了 一 个 数组 a, 第 17 行 和 第 18 行将 数组 A 中 元 素 的 
地 址 存放 到 a 中 。 第 19 行 调用 库 函 数 qsort 对 a 进行 排序 。 注 意 , 传 递 给 qsort 的 第 4 个 参 
数 是 指向 第 1 一 11 行 定义 的 比较 ,由 2 个 两 重 Point 指针 指向 气 站 坐标 数据 的 “大小”。 这 
样 ,a 中 的 元 素 (A 的 元 素 的 地 址 ) 得 到 了 重 排 ,而 A 的 元 素 保持 原来 的 顺序 。 

(3) 第 20 一 25 行 的 for 循环 计算 每 一 个 B[ 癌 的 “界限 ”顶点 : 该 顶点 左边 的 顶点 横 坐 
标 小 于 BLUT Bi AER ,该 顶点 右边 的 顶点 (包括 该 项 点) 的 横 坐 标 大 于 BLUT EAS bs iu 
VAN bounds[i]. $ 26—34 行 的 3 重 蔡 套 循环 对 每 一 个 障碍 物 B[iJ 查 找 包含 它 的 边 并 
加 以 删除 。 其 中 ,第 28—34 行 的 循环 对 B[ 避 左边 的 顶点 aLuj 及 右边 的 顶点 aLv] 构 成 的 
边 检 测 B[] 是 否 含 于 该 条 边 。 第 30 行 调 用 第 5 章程 序 5-2 定义 的 函数 direction, 检 测 
alu] 、B[ 训 、aLvj 是 否 共 线 (函数 返回 值 为 0)。 若 是 ,第 31 行 确定 aLul.a[v]fE A 中 的 位 
置 bp.q, 第 32 行 反 查 w[p,qd] 和 w[q,p] 并 置 为 DBL_MAX( 用 此 常量 代替 表示 ce) ,将 此 边 
删除 。 

3) 计算 最 优 管道 

有 了 上 述 的 准备 ,现在 来 实现 计算 最 优 管道 的 计算 过 程 。 

1 int round(double x) { 


2 int a=x; 
3 if(x—a>=0. 5) 


4 atc: 

5 return a; 

6) 

7 int pipeLaying(Point * A,int n,Point * B,int m,double * p,int s,int t){ 
8 pair r; 

9 int x; 


10 double * w— makeGraph( A. p.n), * d; 
ll fixGraph(w,A,B,n,m); 

12  r-dijkstra(w.n,s—1); 

13  d- (double * )r. first; 

14 x=round(d[t—1]); 

15  freeCw) ;free(r. second) ;free(d) ; 

16 return x; 


程序 9-13 ”实现 算法 9-14 的 C 函数 


第 7 一 17 行 定义 的 函数 pipeLaying ,代码 与 算法 的 伪 代 码 结 构 十 分 接近 。 需 要 注意 如 
下 问题 。 

COD 按 题 面 要 求 , 计 算出 来 的 从 s 点 到 +t 点 最 小 铺设 费用 要 四 使 五 入 为 整数 。 所 以 ， 
第 1 一 6 行 定义 了 计算 浮 点 型 数据 四 舍 五 入 为 整数 的 函数 round, 

(2) 第 12 行 调用 程序 9-10 定义 的 函数 dijkstra 对 修改 过 的 图 的 权 和 矩阵 w 及 起 点 s( 由 
于 数组 下 标 从 0 开始 编码 ,所 以 图 的 项 点 编码 也 从 0 开始 ,于 是 传递 给 dijkstra 的 第 3 个 参 
BOA s 一 1) 计 算 单 源 最 短路 径 。 回 忆 该 函数 返回 2 个 计算 结果 : s 到 每 一 个 定点 的 最 短 距 
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A d 及 各 条 路 径 中 每 个 顶点 的 父 结 点 数组 pi。 我 们 只 需要 数组 d, 以 及 d 中 d[t]( 在 这 里 是 
d[t-1D. 

调用 函数 pipeLaying 解决 Pipe Laying 问题 的 main 函数 定义 连同 程序 9-11 ~ f 
JF 9-13 都 存储 在 文件 夹 chap09/Pipe Laying Problem 中 的 源 文件 PipeLayingProblem. c 
中 ,读者 可 打开 文件 研读 。 
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图 是 用 来 表示 现实 世界 中 对 象 之 间 关 系 的 数学 模型 ,所 以 它 是 信息 技术 中 用 来 表达 各 
种 应 用 系统 的 强 有 力 的 逻辑 模型 。 随 着 信息 技术 应 用 的 不 断 深 化 ,在 模拟 人 的 智力 活动 的 
人 工 智能 技术 中 ,表达 知识 就 需要 借助 图 。 图 的 搜索 指 的 是 系统 地 沿 图 的 边 访问 图 中 的 顶 
点 的 过 程 。 一 个 图 搜索 算法 可 能 发 现 关于 图 的 结构 的 更 多 信息 。 很 多 算法 是 从 搜索 输入 的 
图 而 得 到 这 些 结构 信息 开始 的 ,还 有 很 多 图 算法 是 对 基本 图 搜索 算法 的 简单 扩展 。 图 的 搜 
索 技术 是 图 算法 领域 的 核心 ,本 章 运 用 前 9 章 讨 论 过 的 算法 设计 方法 来 设计 有 效 的 图 的 搜 
索 算 法 ,并 探讨 几 个 基本 应 用 问题 。 

从 第 3 章 起 ,我 们 就 讨论 过 图 。 对 图 (有 向 或 无 向 )G 王 二 V, 眉 > (为 方便 ,假定 V={1， 
1 G.D€E 
0 G.DEE 
(Gd 委 ij 入 2) 。 在 计算 机 中 ,和 矩阵 可 以 很 方便 地 用 一 个 数组 加 以 表示 ,这 在 前 几 章 已 有 体会 。 
但 是 从 算法 的 时 间 效 率 角度 考虑 ,有 时 需要 另外 一 种 表示 图 G 的 数据 结构 ,这 就 是 现在 需 
要 跟 大 家 介绍 的 图 的 邻接 表 表示 。 

图 G= 二 V,E 二 的 邻接 表 表 示 是 一 个 由 1V | 个 链表 组 成 数组 ,对 每 个 wEV, 链 表 
Adj[u]j 称 为 对 应 顶点 u 的 邻接 表 。 它 包含 G 中 所 有 与 相 邻 的 顶点 。 每 个 邻接 表 中 顶点 
通常 是 按 任意 顺序 存放 的 。 图 10-1(b) 是 图 10-1(a) 中 的 无 向 图 的 一 个 邻接 表 表示 。 类 似 
地 ,图 10-2(b) 是 图 10-2(a) 中 的 有 向 图 的 一 个 邻接 表 表示 。 


Vp 


2,…,n}), 是 用 图 的 邻接 矩阵 A = Cajus, ERRA JEP, aj = 


^ wb 一 


图 10-1 无 向 图 及 其 邻接 表 表 示 


(a) 
图 10-2 有 向 图 及 其 邻接 表 表 示 


从 算法 到 程序 (第 2 NO 


在 正式 开始 讨论 图 的 搜索 算法 之 前 , 先 通 过 一 个 例子 来 了 解 图 的 邻接 表 是 如 何 影 响 算 
法 的 时 间 效 率 的 。 有 向 图 G 二 二 V,E 一 的 转 置 是 一 个 图 GT=<V.ET>. Hp ET— (Go) € 
VXV : (u,v) CE}. BIG? 就 是 将 G 中 的 边 反 向 而 得 。 

对 邻接 矩阵 表示 的 图 ,算法 伪 代 码 如 下 。 

TRANSPOSE-DIRECTED-GRAPH(G) 

1 for u<-1 to |V| do 

2  forv--1 to |V| do 

3 AT[v.u]--A[u.v] 

4 return G7 


算法 10-1 有 向 图 的 转 置 算法 (邻接 矩阵 版 本 ) 


其 中 ,A7 RRG 的 邻接 和 矩阵。 显然 ,其 运行 时 间 为 OAV). 
对 邻接 表 表示 的 图 ,算法 伪 代 码 如 下 。 
TRANSPOSE-DIRECTED-GRAPH(G) 

1 for each .€ V do 

2 Adj'[u]--NIL 

3 for each «EV do 

4 for each v€ Adj[u] do 
5 INSERTCAdj" [v], u) 
6 return G^ 


算法 10-2 有 向 图 的 转 置 算法 (邻接 表 版 本 ) 
JE Adj” AR GT 的 邻接 表 。 第 1 行 和 第 2 行 耗 时 |V|, 第 3 行 和 第 4 行 耗 时 |E|, 所 以 ， 
总 耗 时 @(IV| 十 |E1)。 
当 |E| 与 1V| 渐 近 相 等 时 ,显然 用 邻接 表 表示 的 图 的 算法 比邻 接 算 阵 表示 的 图 的 算法 更 好 。 
所 以 ,本 章 中 除非 特别 声明 ,总 是 假定 图 (无 论 是 有 向 图 还 是 无 向 图 ) 是 用 其 邻接 表 表 示 的 。 


10.1 深度 优先 搜索 


10.1.1 算法 描述 与 分 析 


1. 问题 的 理解 与 描述 


深度 优先 搜索 (Depth First Search,DFS) 所 遵循 的 策略 ,如 同 其 名 称 所 云 ,是 在 图 中 尽 
可 能 “更 深 ” 地 进行 搜索 。 在 深度 优先 搜索 中 ,对 最 新 发 现 的 顶点 w, 若 此 顶点 尚 有 未 探索 过 
从 其 出 发 的 边 就 进行 探索 。 当 wv 的 所 有 边 都 被 探索 过 ,搜索 “回溯 ”到 从 其 出 发 发 现 顶点 
v 的 顶点。 此 过 程 继 续 直 至 发 现 所 有 从 源 点 可 达 的 顶点 。 在 这 个 搜索 过 程 中 ,只 要 在 某 个 
已 发 现 的 顶点 wv 的 邻接 表 中 发 现 一 个 顶点 w, 则 将 o 的 父亲 指针 elu EA v 这样 会 形成 
一 棵 以 源 点 为 根 的 树 一 一 深度 优先 树 。 若 图 中 还 有 未 发 现 的 顶点 , 则 以 其 中 之 一 为 新 的 源 
点 重复 搜索 ,直至 所 有 的 顶点 都 被 发 现 。 这 样 ,搜索 轨迹 G 将 形成 一 片 由 若干 棵 深度 优先 
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树 构 成 的 森林 一 一 深度 优先 森林 。 

在 搜索 过 程 中 ,用 顶点 的 颜色 来 指示 顶点 的 状态 。 每 一 个 顶点 初始 时 是 白色 的 ,搜索 一 
且 被 发 现 就 变 成 灰色 , 当 其 完成 时 也 就 是 它 的 邻接 表 被 完全 考察 过 就 成 为 黑色 的 。 为 了 通 
过 深度 优先 搜索 揭示 图 的 更 多 信息 ,在 深度 优先 搜索 过 程 中 对 每 一 个 顶点 跟踪 两 个 时 间 : 
发 现时 间 au ASE CER] flu], duek EKRA C 由 白色 变 成 灰色 ) 时 刻 ,f[uj 记 录 
完成 的 邻接 表 检 测 ( 变 成 黑色 ) 时 刻 。 换 名 话说 ,对 每 个 顶点 w, 必 有 

d[u] < flu] (10-1) 

在 时 间 d[wj 前 顶点 是 白色 的 (WHITE), 在 时 间 dla JA f[uj 之 间 是 灰色 的 (GRAY)， 
f[uj 之 后 是 黑色 的 (BLACK)。 所 有 这 些 时 间 是 介 于 1 到 2 |V| 的 整数 ,这 是 因为 对 |V | 
顶点 的 每 一 个 而 言 仅 发 生 一 次 发 现 事 件 和 一 次 完成 事件 。 

把 图 的 深度 优先 搜索 问题 形式 化 为 如 下 。 

输入 : AG=<V.E>. 

输出 : G 的 深 优先 森林 G. 以 及 图 中 各 顶点 在 搜索 过 程 中 的 发 现时 间 和 完成 时 间 。 


2. 算法 的 伪 代 码 描述 


算法 10-3 的 伪 代 码 是 基本 的 深度 优先 算法 , 它 利 用 一 个 栈 来 控制 对 顶点 的 访问 顺序 。 
“ 栈 ” 是 一 种 插入 和 删除 操作 都 在 同一 端 进行 的 线性 表 。 它 具有 元 素 先进 后 出 的 特性 。 输 入 
的 图 G 可 以 是 无 向 图 也 可 以 是 有 向 图 。 变 量 rime 是 一 个 用 来 表示 时 间 的 变量 。 


DFS(G) 

1 foreach vertex uE V[G] 

2 do color[u]-- WHITE 

3 zLu]-- NIL 

4 time--0 

5 SO 

6 for each vertex s€ V[G] 

7 do if colors] — WHITE 

8 then color[ s]-- GRAY 

9 d[s]--time--time--1 

10 PUSH(S,s) 

11 while Sz 

12 do ux-TOP(S) 

13 if 3 Dv€ Adj[w] and color[ v] - WHITE 
14 then color[ v]--GRAY 

15 [vu 

16 d[v]<time<-timet+1 
17 PUSH(S,v) 

18 else colorLu]-- BLACK 
19 f Lu]--time-—time-1 
20 POP(S) 


21 return d, f.and x 
算法 10-3 ”对 图 的 深度 优先 搜索 算法 


QD ”是 数理 逻辑 中 的 存在 量词 , 意 为 存在 ……”。 
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过 程 DFS 运行 如 下 。 

第 1 一 3 行将 所 有 的 顶点 着 上 白色 并 将 它们 的 x 域 初始 化 为 NIL。 第 4 行将 时 间 计 数 
器 置 为 0。 第 6 一 19 行 的 for 循环 依次 检测 V. 中 的 每 个 顶点 * ,一 旦 发 现 一 个 白色 的 顶点 ， 
就 以 此 顶点 为 源 顶 点 ,以 深度 优先 的 方式 搜索 从 s 可 达 的 所 有 顶点 。 该 循环 的 每 次 重复 , 顶 
A s 变 成 深度 优先 森林 中 的 一 棵 新 树 的 根 。 第 8 行将 s 着 成 灰色 ,第 9 行将 时 间 计 数 器 
time 增加 了 1 并 作为 s 的 发 现时 间 d[sj, 第 10 行 将 ;加 入 到 栈 S 中 。 第 11 一 20 行 的 while 
循环 借助 栈 S 以 深度 优先 的 方式 搜索 所 有 从 可 达 的 顶点 : 每 次 重复 寻找 与 处 于 栈 顶 的 顶 
点 坟 相 邻 且 未 曾 发 现 过 的 (和 白色) 顶点 v( 第 13 行 的 检测 )。 若 有 这 样 的 顶点 , 则 将 其 改 为 灰 
色 , 记 录 其 发 现时 间 alu]. IE x[vj, 并 压 入 栈 S, 这 时 说 深度 优先 搜索 探索 了 边 (u,v)。 
否则 ,将 处 于 栈 顶 的 顶点 u 着 成 黑色 ,记录 完成 时 间 f Luc] 将 其 从 栈 S 中 弹出 。 当 DFS 返回 
时 ,图 中 每 个 顶点 u 就 被 赋予 一 个 发 现时 间 d[4] 和 一 个 完成 时 间 Lu] LR 在 深度 优先 
森林 中 的 父 结 点 [uj。 对 一 个 图 的 DES 的 过 程 如 图 10-3 所 示 。 


SER 


* 


s[e[- e] 


w 


SIE 


图 10-3 ”深度 优先 搜索 算法 DFS 施 于 一 个 图 的 过 程 (各 顶点 按 发 现时 间 / 完 成 时 间 格 式 做 标记 ) 


注意 : 深度 优先 搜索 的 结果 可 能 依赖 于 DFS 的 第 6 行 所 检测 的 顶点 的 顺序 ,以 及 第 
13 行 所 访问 的 各 相 邻 顶点 的 顺序 。 这 些 不 同 的 访问 顺序 并 不 会 在 实践 中 发 生 什么 问题 ,但 
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搜索 形成 的 深度 优先 搜索 森林 的 形态 可 能 有 所 不 同 。 深 度 优先 搜索 的 任 一 结果 都 可 用 另 一 
本 质 上 等 价 的 结果 蔡 代 。 
3. 算法 的 运行 时 间 
DFS 的 运行 时 间 如 何 ? 第 1 行 和 第 2 行 的 循环 耗 时 OCV). ARTE 14 一 20 行 操作 
对 G 的 每 条 边 执行 一 次 ,因此 耗 时 
2) | Adj[v] |= OC 
vEV 
所 以 DFS 的 运行 时 间 为 OV +E). 


10.1.2 程序 实现 


1. 图 的 邻接 表 表 示 


用 邻接 表 来 表示 图 。 利 用 在 第 2 章 开 发 的 链表 LinkedList( 保 存在 DataStructure 目录 


下 的 头 文件 list. h 和 源 文件 list. c 内 ) 作 为 每 个 顶点 的 邻接 表 。 


1 typedef struct{ 
2 double weight; 


3 int index; 

4 ) vertex; 

5 typedef struct Graph 

6 LinkedList **adj; 

7 int n; 

8 ) Graph; 

9 int vComp(vertex *a,vertex * b){ 

10 return a-»index-b-»index; 

11) 

12 Graph * zeroGraph(int n) ( 

13 inti; 

14 Graph * g= (Graph * ) malloc(sizeof(Graph) ) ; 
15 g->n=n; 

16 g->adj=(LinkedList**) malloc(n * sizeof( LinkedList * )) ; 
17 for(i=0;i<n;it++) 

18 g-»adjl i] — createList(sizeof( vertex) ,vComp) ; 
19 return g; 

20 } 

21 void addEdge(Graph * g,int u.int v.double w) { 
22 vertex x={wsv}; 

23 listPushBack(g-»adj[ u]. 8-3) ; 

24 } 

25 void graphClear(Graph * g)( 

26 inti; 

27 LinkedList *1; 


/* 权 */ 
/* 顶点 编号 */ 


/* 邻接 表 数 组 * / 
/* 顶点 数 * / 


/* 两 个 结 点 ab 的 比较 * / 


/ * 按 编号 比较 大 小 * / 


/* 创建 零 图 * / 


/* 确定 顶点 个 数 */ 


/* 为 每 个 顶点 创建 邻接 表 * / 


/* 向 图 中 添加 边 */ 
/* Ww) MLA wx / 


/* 清理 图 的 邻接 表 存 储 空间 * / 
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28 for(i=g—>n—1;i>=0;i——){ /* 清 理 每 个 顶点 的 邻接 表 * / 
29 l=g->adjLils 

30 — elrList(1, NULL); 

31 freeCD ; 

32 ) 

33 free(g-»ad : / * 释放 邻接 表 数 组 * / 

34 g-»n—0; 

35) 


程序 10-1 实现 图 的 邻接 表 表示 的 C 源 代码 


对 程序 10-1 的 说 明 如 下 。 

CD 第 1~4 行 定义 了 顶点 邻接 表 中 结 点 的 数据 类 型 vertex。 它 包含 两 个 属性 : 表示 顶 
点 编号 的 index 及 表示 与 宿主 顶点 构成 的 边 的 权 值 w。 在 表示 无 权 图 时 ,w 的 值 均 为 1。 第 
5 一 8 行 定 义 了 表示 图 的 邻接 表 的 数据 类 型 Graph。 它 有 2 个 属性 : 表示 邻接 表 数 组 的 
adj 和 表示 顶点 个 数 的 n。 

(2) 第 12 一 20 行 定义 的 函数 zeroGraph 创建 一 个 具有 个 顶点 的 零 图 0。 其 中 ,第 
15 行 确定 图 g 有 n 个 顶点 。 第 17 行 和 第 18 行 的 for 循环 为 每 个 顶点 创建 LinkedList 型 的 
邻接 表 。 注 意 ,调用 函数 createList 创建 链表 时 传递 的 第 1 个 参数 表示 链表 中 每 个 结 点 存 
WK vertex 类 型 的 数据 ,第 2 个 参数 传递 的 是 用 于 在 链表 中 查找 结 点 时 所 需 的 比较 结 点 的 函 
数 指针 vComp ,该 函数 定义 在 第 9—11 fT. 

第 21 一 24 行 定义 的 函数 addEdge 在 由 参数 g 指引 的 图 中 ,插入 由 参数 u 和 v 决定 的 
边 。 参 数 w 表示 边 (u,v) 的 权 。 第 22 行 用 w A v 生成 一 个 结 点 x, 第 23 行将 x 插 和 到 链表 
g 一 二 adj[u] 中 。 

(3) 由 于 图 的 邻接 表 中 含有 链表 ,在 表示 图 的 数据 废弃 不 用 前 需 清理 所 占用 的 动态 空 
间 。 第 25 一 35 行 定义 的 函数 graphClear 就 是 用 来 清理 由 参数 g 表示 的 图 的 邻接 表 的 存储 
空间 的 。 其 中 ,第 28 一 32 行 的 for 循环 调用 函数 clrList 清理 链表 g 一 二 adj[ 口 的 存储 空间 。 
第 33 行 清理 顶点 数组 adj 的 存储 空间 。 

为 便于 代码 重用 ,程序 10-1 中 的 数据 类 型 定义 及 函数 声明 存储 在 文件 夹 graph 中 的 头 
文件 graph. h 中 ,函数 定义 存储 在 同一 文件 夹 中 的 源 文件 graph. c 中 。 


2. 实现 DFS 
在 实现 了 图 的 邻接 表 表 示 后 ,下 面 实现 计算 图 的 深度 优先 搜索 的 DFS 过 程 。 


1 typedef enum {WHITE,GRAY,BLACK} Color; 
2 pair dfs(Graph * g){ 
3 pair * df= (pair * ) mallocCsizeof( pair) ) ; 


4 int u.s.n—g-^n.v.m— n.time—0, 

5 * pi— (int * )malloc(n * sizeofCint)) , / * 深度 优先 森林 结 点 的 父 结 点 数组 / 
6 * d= (int * ) malloc(n * sizeofCint)) . / * 发 现时 间 数 组 * / 

7 * {= (int * )malloc(n * sizeof(int)) ; /* 完 成 时 间 数 组 * / 


O 简单 地 说 , 零 图 就 是 只 有 顶点 ,没有 边 的 图 , 即 G— —V ET V — (1,2, n) E-0. 
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Stack * S 一 createStack(sizeof(int) ) ; [*Bx/ 
9 Color * color= (Color * ) malloc(n * sizeof(Color)); /* 顶点 颜色 数组 * / 
10 ListNode **pos- (ListNode**) malloc(n * sizeof( ListNode * )); 
11 for(u—0;u-niud- 3.) Í 


12 pi[u]— —1; 

13 color[u] — WHITE; 

14 pos[u]— g-»adj[ u]-»nil-» next; 
15} 

16 for(s=0;s<n3st++){ 

17 ifCcolor[ s] — — WHITE) ( 

18 color s] - GRAY; 

19 d[s]— ++ time; 

20 push(S, &s); 

21 while( ! stackEmpty(S)) { 

22 ListNode * p; 

23 u= * (int * )(S->top->key) ; 
24 p=pos[u]; 

25 v=(p!=g->adj[u]->nil)? (vertex * )(p->key))->index: 一 1; 
26 while( p! — g-»adj[ u]-»nil8-&-color[ v]! — WHITE) ( 
27 p=p->next; 

28 v=(p!=g->adj[u]->nil)? ((vertex * )(p->key))->index: —1; 
29 } 

30 pos[u]=p; 

31 if(pos[u]!=g->adj[u]->nil) { 
32 color[v]=GRAY; 

33 d[v]=+ + time; 

34 pi[v]=u; 

35 push(S, &-v); 

36 Jelset 

37 color u]— BLACK ; 

38 f[u]— 4- - time; 

39 pop( S ; 

40 } 

41 } 

42 } 

43} 


44 * df=make_pair(d.f); 
45 free(pos) ;free(color) ; 
46 return make pair( pi dD ; 


程序 10-2 实现 图 的 深度 优先 搜索 算法 10-3 的 C 源 代码 


对 程序 10-2 的 说 明 如 下 。 
CD 第 1 行 定义 了 表示 顶点 颜色 的 枚 举 数据 类 型 Color, 以 增加 代码 的 可 读 性 。 与 算法 
过 程 一样 ,函数 dfs 仅 有 一 个 表示 图 的 参数 。 函 数 需 要 返回 3 个 数组 ,表示 深度 优先 森林 的 
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Pi、 各 顶点 发 现时 间 d 和 各 顶点 完成 时 间 {。 设 法 把 d 和 {整合 在 一 个 pair 对 象 中 (pair 是 
在 第 8 章 的 8. 3. 4 节 中 开发 的 结构 体 类 型 ) ,再 把 pi 和 整合 了 df 的 pair 对 象 整合 在 另 一 
个 pair 对 象 中 返回 。 

(2) 第 5 一 7 行 声明 的 3 个 数组 pi.d、f, 对 应 于 算法 中 的 数组 x、d、f。 第 9 行 声明 了 一 
个 与 算法 中 同名 的 顶点 颜色 数组 colors $ 8 行 声明 的 是 栈 类 型 Stack 的 对 象 S, 对 应 于 算 
法 中 的 同名 栈 。 第 11 一 15 行 对 应 算法 10-3 中 的 第 1 一 5 行 的 初始 化 工作 。 

(3) 为 实现 算法 中 第 13 íF if. 3v€ Adj[u] and color[v]— WHITE 的 检测 ,本 质 上 ,这 
需要 在 顶点 的 邻接 表 Adj[uj( 这 是 一 个 链表 ) 中 搜索 ,直到 找到 一 个 白色 顶点 或 发 现 整个 
表 中 不 存在 白色 顶点 为 止 。 所 以 ,可 以 设置 一 个 链表 指针 pb, 初始 值 为 指向 Adj[uj 的 首 结 
点 ,然后 让 其 在 Adj[u] 中 扫描 ,直到 发 现 白色 顶点 或 遇 到 链表 尾 为 止 。 如 果 p 是 在 while 
循环 内 被 初始 化 为 Adj[u] 的 首 结 点 ,而 w 可 能 会 多 次 出 现在 栈 项 ,这 样 就 会 使 得 曾经 访问 
过 与 « 邻接 的 顶点 可 能 会 重复 被 访问 ,这 不 符合 算法 中 对 每 一 条 边 仅 访问 一 次 的 描述 。 为 
避免 这 样 的 情形 ,可 以 事先 为 每 一 个 顶点 设置 一 个 指向 其 邻接 表 的 指针 pos[u], 初 始 化 为 
指向 Adj[ 四 的 首 结 点 。while 的 每 次 重复 中 对 链表 Adj[uj 的 扫描 局 限于 pos[Luj 到 链表 
尾 的 范围 内 ,而 不 再 重新 检测 Adj[uj 首 结 点 到 pos[uj] 之 间 的 那些 已 经 访问 过 的 非 白 色 
顶点 。 程 序 中 第 10 行 声 明了 一 个 以 链表 结 点 指针 ListNode * 为 元 素 类 型 的 数组 pos, 第 
14 行将 它们 初始 化 为 指向 每 个 顶点 u 的 邻接 表 的 首 元 素 。pos[u] 用 来 跟踪 顶点 u 的 邻 
接 表 中 尚未 扫描 过 的 第 一 个 元 素 位 置 。 这 样 ,就 可 保证 在 DFS 过 程 中 ,每 一 条 边 有 且 仅 
有 一 次 被 访问 。 

(4) 第 16 一 43 行 的 for 循环 对 应 算法 10-3 中 的 第 6 一 20 行 构造 图 的 深度 优先 森林 的 
操作 。 其 中 第 24 一 29 行 实现 算法 中 的 第 13 行 寻找 顶点 u 的 相 邻 白色 顶点 : 第 26 一 29 fT 
的 while 循环 在 u 的 邻接 表 中 依次 查找 白色 顶点 ,注意 循环 的 条 件 是 p!=g 一 >adj[u] 一 > 
nil &&color[ v]! — WHITE, JE AY p 是 在 第 24 中 声明 并 初始 化 为 posu ]Il] — + f k 35 
代 器 ,v 是 在 第 25 行 被 初始 化 为 p 所 指向 的 与 u 相 邻 的 顶点。 于 是 ,作为 好 辑 与 的 第 一 个 
条 件 p!=g—>adj[u]— > nil 指 的 是 尚 在 u 的 邻接 表 中 扫描 ,而 第 二 个 条 件 color[vj!= 
WHITE 检测 的 是 表 中 当前 元 素 对 应 的 顶点 是 否 为 白色 。 该 循环 停止 时 或 p 指向 了 一 个 白 
色 顶 点 (第 30 行将 此 位 置 记录 到 pos[Luj 中 ), 这 意味 着 p! =g—>adjlu]—>nil. 8 31 行 检 
测 到 此 条 件 将 引发 第 32 一 35 行 的 操作 ,它们 对 应 算法 10-3 中 的 第 14 一 17 行 的 操作 。 否 
则 ,意味 着 顶点 u 的 邻接 表 扫 描 结 束 仍 未 发 现 白色 顶点 ,这 将 导致 执行 对 应 于 算法 中 第 
18—20 行 的 操作 的 第 37 一 39 行 。 

(5) 第 46 行将 数组 pi, d 和 f 封装 到 两 个 嵌 套 的 pair 对 象 中 返回 。 为 便于 代码 重用 ,把 
程序 存储 在 文件 夹 graph 中 的 头 文件 dfs. h( 函 数 的 原型 声明 ) 和 源 文 件 dfs.c 中 。 


10.1.3 有 向 无 圈 图 的 拓扑 排序 


1. 深度 优先 搜索 的 性 质 


深度 优先 搜索 最 基本 的 性 质 也 许 就 是 搜索 轨迹 构成 若干 棵 树 的 深度 优先 森林 。 首 先 看 


到 ,图 中 的 每 个 项 点 有 且 仅 有 一 次 被 发 现 和 完成 。 所 以 ,每 个 非 源 顶点 的 父 结 点 是 唯一 的 
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( 源 顶 点 没有 父 结 点 ) ,也 就 是 说 ,从 一 个 源 顶点 起 ,搜索 过 程 将 所 有 从 源 顶 点 可 达 的 顶点 构 
成 一 棵 搜索 树 。 但 图 中 一 个 顶点 不 必 从 另 一 个 顶点 s 可 达 , 所 以 在 以 ;为 源 顶 点 进行 深 
度 优先 搜索 过 程 中 ,u 不 必 成 为 搜索 树 中 的 结 点 。 因 此 ,x 可 能 成 为 男 一 个 源 顶 点 ,搜索 过 
程 将 构成 另 一 棵 搜索 树 。 

深度 优先 搜索 的 另 一 个 重要 性 质 是 发 现时 间 和 完成 时 间 具 有 括号 结构 。 如 果 把 顶点 
u 的 发 现时 间 表 示 成 左 括号 “(u”, 并 将 其 完成 时 间 表示 为 “ww)”, 则 发 现 和 完成 的 历史 将 构成 
一 个 在 嵌 套 括号 意义 上 的 良好 结构 表达 式 。 例 如 ,图 10-4(a) 的 深度 优先 搜索 对 应 的 加 括 
号 展示 在 图 10-4(b) 中 。 也 就 是 说 ,图 (有 向 或 无 向 )G 的 深度 优先 森林 中 顶点 v 为 顶点 
u 的 后 代 当 且 仅 当 d [四 过 d[ 四 过 [oj 过 FL。 这 从 算法 的 执行 也 可 见 : 父亲 先 于 孩子 进 
栈 ( 这 意味 着 dLu ]—a Lv D ,而 后 于 孩子 出 栈 ( 这 意味 着 f/Lo]— flu}. rst 0-1) 04 
d[u]-dLv]— fLo]— fLu]. 

深度 优先 搜索 的 另 一 个 有 趣 的 性 质 是 它 可 以 用 来 对 作为 输入 的 图 G= <V E> 003 it 
行 分 类 。 对 图 的 边 的 这 一 分 类 可 用 来 获取 有 关 图 的 重要 信息 。 例 如 ,一 个 有 向 图 是 无 圈 的 
当 且 仅 当 一 个 深度 优先 搜索 将 得 出 无 * 回 ” 边 判 断 。 

可 以 用 由 对 图 G 做 深度 优先 搜索 而 产生 的 深度 优先 森林 Cu 来 定义 4 种 类 型 的 边 。 

CD 树枝 边 是 深度 优先 森林 G, 中 的 边 。 若 v 是 在 探索 边 (u,v) 时 首次 被 发 现 , 则 边 
(u,v) 是 一 条 树枝 边 。 

(2) 回 边 是 那些 从 顶点 “连接 到 其 在 深度 优先 森林 中 的 前 辈 v 的 边 (u,v)。 自 循环 边 
视 为 回 边 。 

(3) 进 边 是 那些 从 顶点 u 连接 到 其 在 深度 优先 森林 中 的 后 代 w 但 不 是 树枝 边 的 边 
(usu). 

(4) 跨 边 是 所 有 其 他 的 边 。 它 们 可 以 是 同一 棵 深度 优先 树 中 两 个 顶点 间 的 边 ,但 其 中 
的 任 一 个 不 是 另 一 个 的 前 辈 ,或 它们 连接 两 棵 不 同 的 深度 优先 树 。 

图 10-4 中 ,各 条 边 都 加 了 表示 它们 类 型 的 标识 。 

DES 算法 可 以 修改 成 能 对 各 条 边 在 遇 到 它们 时 进行 分 类 。 关 键 的 思想 是 每 一 条 边 
(u,v) 在 首次 被 探索 时 可 以 根据 顶点 wv 的 颜色 来 分 类 (但 是 进 边 和 跨 边 不 能 区 分 ) 。 

(OD 白色 (WHITE) 意 味 着 一 条 树枝 边 。 

(2) 灰色 (GRAY) 意 味 着 一 条 回 边 。 

(3) 黑色 (BLACK) 意 味 着 一 条 进 边 或 跨 边 。 

第 一 种 情形 由 算法 可 得 。 对 于 第 二 种 情形 ,注意 各 灰色 顶点 总 是 形成 一 条 对 应 于 栈 中 
的 后 代 线 性 链 :灰色 项 点数 比 最 近 发 现 的 顶点 在 深度 优先 森林 中 的 深度 还 多 一 个 。 探 索 总 
是 从 最 深 的 灰色 顶点 开始 ,所 以 达到 的 另 一 个 灰色 顶点 的 边 就 到 达 一 个 祖先 。 

图 10-4(a) 为 一 个 有 向 图 的 深度 优先 搜索 结果 。 各 顶点 都 标 有 发 现时 间 / 完 成 时 间 且 
各 条 边 的 类 型 。 图 10-4(b) 每 个 顶点 的 发 现时 间 和 完成 时 间 构 成 的 区 间 对 应 于 所 展示 的 加 
括号 。 每 一 个 矩形 跨越 对 应 顶点 的 由 发 现时 间 和 完成 时 间 构 成 的 区 间 。 树 枝 边 也 得 以 展 
示 。 若 两 个 区 间 相交 , 则 一 个 必 嵌 套 在 另 一 个 之 中 , 且 对 应 于 较 小 区 间 的 顶点 是 对 应 于 较 大 
区 间 项 点 的 后 代 。 图 10-4(c) 重 画图 10-4(a) 中 部 分 按 树 枝 边 和 进 边 自 上 而 下 ,而 所 有 的 由 
后 代 到 前 辈 的 回 边 是 自 底 向 上 的 。 

值得 注意 的 是 ,在 一 个 无 向 图 中 ,因为 (u,v) 和 (v,w) 实 际 上 是 一 条 边 。 所 以 在 对 无 向 
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图 10-4 深度 优先 搜索 


图 G 的 深度 优先 搜索 中 ,G 的 每 一 条 边 或 是 树枝 边 或 是 回 边 。 为 说 明 这 一 点 , 设 (u,v) 是 
G 的 任 一 条 边 ,不 失 一 般 性 ,假定 dLuj 二 dL[v]。 于 是 ,v 必 在 完成 4 之 前 被 发 现 ,这 是 因为 
v Eu 的 邻接 表 中 。 若 边 (x,u) 先 从 wx 到 vw 被 探索 到 , 则 (u,vw) 变 成 树枝 边 。 若 (u,v) 先 从 
v 到 被 探索 到 , 则 (u,v) 成 为 回 边 , 因 为 w 在 边 被 首次 探索 到 时 还 是 灰色 的 。 


2. 有 向 无 圈 图 的 拓扑 排序 


1) 问题 理解 与 描述 

由 于 回 边 意 味 着 图 中 存在 一 个 圈 , 所 以 得 到 有 向 图 G 是 无 圈 的 充分 必要 条 件 是 G 的 一 
次 深度 优先 搜索 不 产生 回 边 。 这 样 ,对 DFES 稍 加 修改 就 可 使 其 能 对 传递 给 它 的 有 向 图 判断 
是 否 为 有 向 无 圈 图 (Directed Acyclic Graph, DAG): 设置 一 个 标志 acyclicity, 初 始 时 置 为 
true, 搜 索 过 程 中 车 遇 到 回 边 , 则 将 其 置 为 false。 

用 此 性 质 来 解决 一 个 有 趣 的 问题 : DAG 的 拓扑 排序 。 一 个 有 向 无 圈 图 G 二 二 V ,E> 的 
拓扑 排序 是 其 所 有 顶点 的 一 个 线性 排列 ,使 得 车 边 (u,v) 包 含 在 G 中 . 则 在 排列 中 必 出 现 
在 v 前 (车 图 不 是 无 圈 的 , 则 不 可 能 有 此 线性 排列 )。 一 个 图 的 拓扑 排序 可 被 视 为 将 图 的 所 
有 项 点 水 平 排列 时 ,所 有 的 有 向 边 从 左 指向 右 。 因 此 ,拓扑 排序 与 第 1 章 和 第 2 章 中 研究 的 
那 种 “排序 ”是 不 同 的 。 把 有 向 图 的 拓扑 排序 问题 形式 化 为 如 下 。 

输入 : 有 向 图 G。 

输出 : 4 G HE DAG. Hih G 的 各 顶点 的 一 个 拓扑 排序 ,否则 输出 出 错 信 息 。 

有 向 无 圈 图 DAG 在 很 多 应 用 中 用 来 说 明 事件 间 的 先后 顺序 。 图 10-5 给 出 了 发 生 在 
某 计 算 机 系 安排 各 门 课程 的 教学 时 的 一 个 例子 。 由 于 必须 在 学 习 一 些 课 程 之 前 学 完 一 些 课 
程 (例如 ,必须 在 学 习 普通 物理 前 学 完 高 等 数学 ) ,而 对 另 一 些 课程 却 可 按 任意 顺序 进行 ( 例 
如 ,程序 设计 与 政治 经 济 学 等 )。 在 图 10-5(a) 中 的 有 向 无 圈 图 中 的 一 条 有 向 边 (u,v) 意 味 
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着 课程 u 必须 在 v 之 前 学 完 。 所 以 ,此 有 向 无 圈 图 的 一 个 拓扑 排序 给 出 了 一 个 教学 顺序 。 
图 10-5(b) 展 示 了 对 此 有 向 无 环 路 图 作 拓 扑 排 序 后 水 平 排列 的 各 个 顶点 使 得 所 有 有 向 边 都 
是 从 左 指向 右 。 


政治 高 等 普通 |- {计算 机 】 ( 离散 
的 


19/20 11/18 14/17 15/16 12/13 


(b) 
图 10-5 拓扑 排序 实例 


2) 算法 的 伪 代码 描述 

由 于 在 图 的 深度 优先 搜索 过 程 中 ,顶点 间 的 前 辈 与 后 代 的 关系 就 是 按照 边 的 指向 引导 
的 。 顶 点 的 完成 时 间 三 标示 出 了 项 点 间 前 辈 /后 代 关 系 : 车 u 是 wv 的 前 辈 , 则 [aq 之 Au]。 
在 DFS 中 也 意味 着 dk v 之 前 出 栈 。 也 就 是 说 ,对 一 个 有 向 无 圈 图 做 DFS 的 过 程 中 ,只 要 
按照 顶点 出 栈 顺序 跟踪 各 项 点 ,就 可 得 到 它们 的 拓扑 排序 。 


TOPLOGICAL-SORT(G) 
1 for each vertex uE V[G] 


2 do color[u]-- WHITE 

3 acyclicity*-true 

4 SØ 

5 m- |VEG]I 

6 for each vertex s€ V[G] 

y do if color s] WHITE 

8 then color s]-- GRAY 

9 PUSH(S,s) 

10 while SØ 

11 do u--TOPCS) 
12 if 3v€ Adjlu] and color v] - GRAY 
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13 then acyclicity<false 

14 if 3v€ Adj[w] and color[v]= WHITE 
15 then color v]--GRAY 

16 PUSH(S. 9) 

17 else color[ u]-- BLACK 

18 top-logic(m]<u,m<m—1 

19 Pop(S) 


20 return acyclicity and top-logic 


算法 10-4 计算 有 向 无 圈 图 的 拓扑 排序 的 算法 


在 第 3 行 增添 了 一 个 变量 acyclicity, 并 将 其 初始 化 为 true, 作 为 表示 图 是 否 无 圈 的 标 
志 。 第 5 行 声明 了 一 个 变量 m 初始 化 为 顶点 数 ,指示 当前 顶点 加 入 拓扑 序列 的 位 置 。 

对 处 于 S 栈 顶 的 顶点 u 的 邻接 表 中 搜索 白色 顶点 (第 15 行 ) 前 , 若 搜索 到 灰色 顶点 (第 
13 £1) ,这 意味 着 搜索 到 一 条 回 边 ,也 就 是 说 ,G 有 一 个 圈 。 此 时 ,将 变量 acyclicity EOS 
false( 第 13 行 ) 。 

当 一 个 顶点 完成 访问 在 第 17 行 被 染 成 黑色 ,就 可 在 第 18 行将 其 存储 于 toplogicUm] 
中 ,m 减 1, 保 证 下 一 个 出 栈 的 项 点 排 在 前 面 ,而 在 第 18 行将 其 弹出 栈 S。 

第 20 行 返回 标志 acyclicity 及 top-logic。 

图 10-5(b) 展 示 了 以 拓扑 排序 的 顶点 按 完成 时 间 的 降序 排列 。 

由 于 算法 10-4 的 运行 时 间 与 算法 10-3 的 运行 时 间 一 致 ,所 以 ,可 以 在 时 间 OCV + E) 
内 计算 有 向 无 圈 图 G— —V .E> 的 拓扑 排序 。 


3. 程序 实现 


考虑 算法 中 第 12 行 的 检测 条 件 3v€ AdjLu] and color[ v] GRAY 及 第 14 行 的 检测 
AE Ave Adj[uj and color[v]= WHITE 的 实现 。 我们 知道 3 是 存在 量词 , 它 意味 着 “ 存 
在 ……”。 这 在 程序 中 就 意味 着 要 在 Adj[u] 中 进行 查找 。 最 简单 的 办 法 就 是 线性 查找 法 : 
依次 检测 其 中 的 每 一 个 元 素 ,直至 找到 符合 条 件 的 元 素 为 止 。 并 且 这 两 个 条 件 实 际 上 是 在 
同一 个 集合 一 一 顶点 u 的 邻接 表 Adj[uj 中 考察 灰色 顶点 (前 者 ) 或 白色 顶点 (后 者 ) 的 存在 
性 。 因 此 ,可 以 用 一 个 循环 结构 同时 完成 这 两 个 条 件 的 检测 : 依次 扫描 Adj[wj 中 尚未 访问 
过 的 元 素 , 直 至 找到 白色 项 点。 在 找到 白色 顶点 前 遇 到 灰色 项 点 , 则 第 12 行 的 条 件 满足 , 需 
要 执行 第 13 行 的 操作 。 找 到 白色 顶点 了 ,第 14 行 的 条 件 为 真 ,执行 第 15 行 和 第 16 行 的 

1 pair toplogicalSort(Graph * g)( 

2 Stack * S=createStack(sizeof(int) ) ; 

3 int u,s,n—g-»n,v,m- n, * acyclicity— (int * )malloc(sizeof(int) ) , 

4 * topLogic= (int * ) malloc(n * sizeof(int) ) ; 

5 Color * color= (Color * ) malloctn * sizeof( Color) ) ; 

6 ListNode **pos— (ListNode**) malloc(n * sizeof( ListNode * )) ; 

id for(u=0;u<n;u++){ 

8 color[ u] - WHITE; 

9 posLu]— g-»adi[ u]-»nil-»next; 
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10 } 
11 * acyclicity=1; 
12 for(s=0;s<n;s++){ 


13 ifCcolor[ s]— — WHITE) ( 

14 color[s] - GRAY; 

15 push(S, 8.5); 

16 while !stackEmpty(S)) ( 

17 ListNode * p; 

18 u= * (int * )(S->top->key) ; 

19 p= pos[u]; 

20 v=(p!=g->adj[u]->nil)? ((vertex * )(p->key))->index: 一 1; 
21 while(p! — g-»adj[ u]-»nil8-8&-color[ v]! — WHITE) { 
22 if(color[v]— — GRAY) 

23 * acyclicity—0; 

24 p=p->next; 

25 v—(p!—g-»adj[u]-»niD? (vertex * )(p->key)) -^index: —1; 
26 ) 

27 posLu]— p: 

28 ifCpos[u]! — g-»adj[u]-»niD ( 

29 color[ v] - GRAY; 

30 push(S, 8v) ; 

31 }else{ 

32 color[u]=BLACK; 

33 topLogic[ — —m]=u; 

34 pop(S)s 

35 ) 

36 ) 

37 } 

38 ) 


39 ÍreeCpos) ;free[ color]; 
40 return make pair(acyclicity , topLogic) ; 


程序 10-3 ”实现 算法 10-4 的 C 源 代码 


对 程序 10-3 的 说 明 如 下 。 

A) 和 算法 一 样 ,函数 toplogicalSort 只 有 一 个 参数 ,图 的 邻接 表 g, 返 回 计 算 所 得 无 圈 
有 向 图 标志 acyclicity 和 数组 topLogic 构成 的 pair 型 对 象 。 

(2) 第 3 行 声明 的 指针 变量 acyclicity 对 应 于 算法 中 同名 的 无 圈 有 向 图 标志 ,初始 化 为 
true。 第 4 行 和 第 5 行 声明 的 数组 toplogic 与 color 对 应 于 算法 中 同名 的 顶点 拓扑 顺序 数 
组 和 顶点 颜色 数组 。 

(3) 第 12 一 38 行 的 for 循环 对 应 算法 10-4 中 的 第 6 一 19 行 ,计算 G 的 拓扑 排序 的 操 
作 。 其 中 第 21 一 26 行 的 while 循环 行 实现 算法 中 的 第 13 行 搜索 与 顶点 u HHA H 
点 ,此 间 , 若 遇 到 回 边 ( 在 第 22 检测 到 ) , 则 将 无 圈 标 志 acyclicity 置 为 false。 这 样 就 实现 了 
算法 10-4 中 第 12 行 和 第 13 行 的 检测 回 边 的 操作 。 
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(4) 第 33 行将 完成 访问 的 顶点 u 加 入 到 拓扑 顺序 数组 topLogic 中 。 第 40 行将 
acyclicity 和 topLogic 封装 在 一 个 pair 对 象 中 ,然后 返回 。 

为 便于 代码 重用 ,程序 10-3 存储 在 文件 夹 graph 中 的 头 文件 topsort. h( 函 数 原型 声明 ) 
及 源 文件 topsort. c( 函 数 定义 ) 中 。 


10.1.4 应 用 一 一 全 排序 


Sorting It All Out 


An ascending sorted sequence of distinct values is one in which some form of a less- 
than operator is used to order the elements from smallest to largest. For example, the 
sorted sequence A. B. C. D implies that AX B,B<C and C<D. in this problem, we will 
give you a set of relations of the form A<B and ask you to determine whether a sorted 
order has been specified or not. 

Input 

Input consists of multiple problem instances. Each instance starts with a line 
containing two positive integers n and m the first value indicated the number of objects to 
sort, where 2< n< 26. The objects to be sorted will be the first n characters of the 
uppercase alphabet. The second value m indicates the number of relations of the form A< 
B which will be given in this problem instance. Next will be m lines. each containing one 
such relation consisting of three characters: an uppercase letter.the character “<” and a 
second uppercase letter. No letter will be outside the range of the first » letters of the 
alphabet. Values of n=m=0 indicate end of input. 

Output 

For each problem instance.output consists of one line. This line should be one of the 
following three: 

Sorted sequence determined after xxx relations: yyy**ty. 

Sorted sequence cannot be determined. 

Inconsistency found after xxx relations. 

where xxx is the number of relations processed at the time either a sorted sequence is 
determined or an inconsistency is found. whichever comes first. and yyy…y is the sorted, 
ascending sequence. 

Sample Input 

46 

A<B 

A<C 

B<C 

C<D 

B<D 

A<B 
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32 

A<B 

B<A 

261 

A<Z 

00 

Sample Output 

Sorted sequence determined after 4 relations: ABCD. 
Inconsistency found after 2 relations. 


Sorted sequence cannot be determined. 
l. 问题 描述 与 分 析 


此 问题 的 输入 案例 是 个 对 象 间 的 mx 个 “二 ?关系 ,要 求 由 此 判断 这 ?个 对 象 是 否 存在 
一 个 全 序 , 也 就 是 能 否 将 此 个 对 象 按 彼此 的 二” 关系 排 成 一 列 。 如 果 答 案 是 肯定 的 , 则 报 
告 这 m 个 关系 中 最 先 能 确定 这 一 先后 序列 的 关系 数 。 否 则 ,车 m 个 关系 中 如 果 存 在 矛盾 的 
关系 则 报告 首次 产生 了 矛盾 的 关系 序号 ,如果 这 m 个 关系 不 足以 判断 是 否 所 有 的 对 象 都 能 参 
与 前 后 排列 , 则 报告 无 法 确定 信息 。 例 如 ,在 第 一 个 输入 样 例 中 ,所 有 6 个 关系 都 不 相互 矛 
盾 , 且 前 4 个 关系 已 涉及 所 有 4 个 对 象 ,所 以 输出 由 前 4 个 关系 决定 了 ABCD 的 顺序 。 对 
第 二 个 输入 实例 ,由 于 两 个 关系 是 相互 矛盾 的 ,所 以 输出 报告 由 前 两 个 关系 得 出 矛盾 的 信 
息 。 第 三 个 输入 实例 应 当 有 26 个 对 象 , 但 仅 给 出 一 对 对 象 之 间 的 关系 ,不 足以 确定 所 有 对 
象 的 前 后 顺序 ,所 以 报告 不 确定 信息 。 

把 问题 形式 化 为 如 下 。 

输入 : 一 组 用 字母 A、.B、… ,表示 的 个 对 象 (1 三 n 三 26),m 个 表示 这 个 对 象 中 的 
m 对 对 象 之 间 的 “一 ”关系 。 

输出 : 若 这 m 个 关系 不 产生 对 象 间 的 顺序 矛盾 , 且 前 m (Sr) A KH ALVA ED XXE» A 
对 象 的 前 后 顺序 , 则 报告 前 wu 个 关系 确定 对 象 的 前 后 顺序 ,并 输出 这 个 顺序 。 若 这 m 个 关 
系 存 在 矛盾 , 则 报告 首次 出 现 矛 盾 的 关系 序号 。 若 mm 个 关系 不 足以 确定 这 个 对 象 的 先后 
顺序 , 则 报告 不 确定 信息 。 

如 果 把 输入 中 的 对 象 抽象 为 硕 点 ,对 象 间 的 关系 抽象 成 项 点 间 的 有 向 边 , 则 输入 实例 就 
构成 一 个 有 向 图 。 这 个 问题 与 讨论 的 有 向 图 是 否 为 DAG, 并 对 DAG 做 拓扑 排序 的 问题 相 
关 , 关 系 间 的 矛盾 意味 着 图 中 有 圈 存 在 。 如 果 m 个 关系 相 容 ,意味 着 该 有 向 图 是 一 个 
DAG, 所 以 可 以 计算 出 它 的 拓扑 排序 。 然 而 ,不 同 的 是 : 首先 ,对 于 有 圈 图 ,需要 报告 输入 中 
的 第 几 个 关系 将 产生 矛盾 ? 对 于 DAG ,如果 其 中 包含 独立 项 点 ,虽然 拓扑 排序 存在 ,但 在 我 
们 的 问题 中 认为 是 不 确定 的 情形 。 最 后 ,对 于 有 确切 解 的 情形 ,还 需要 知道 m 中 最 先 能 确 
定 解 的 mi 个 关系 。 

算法 思想 是 ,将 对 应 于 关系 表达 式 的 图 的 边 逐 一 插入 图 中 并 检验 是 否 有 圈 。 在 此 过 程 
中 记录 下 首次 排序 成 功 的 对 关系 编号 ,首次 失败 的 关系 编号 ,或 最 终 得 出 不 能 判断 的 结论 
(关系 ) 。 
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SoRTING-IT-ALL-OUT(R) 

1 success*-0  failed4—-9 ,count<—0 

2 for i<-1 to m 

3 do (u,v) -R, 对 应 的 边 

4 if failed>m 

5 then add (u,v) toG 

6 (acyclicity ,top-logic )*-TOPLOGICAL-SORT(G) 

? if acyclicity= true 

8 then 将 uv 中 未 曾 访问 过 的 个 数 累 加 到 count 
9 if count 首次 达到 nthen successi 

10 else failed<i 

11 if failed cm 

12 then print "Inconsistency found after " failed " relations. " 
13 else if count<n 


14 then print "Sorted sequence cannot be determined. " 
15 else print "Sorted sequence determined after" , success 
16 print "relations;" ,top-logic 


算法 10-5 HH Sorting it all out 问题 的 过 程 
2. 程序 实现 
在 C 语 言 中 ,下 列 程序 实现 算法 10-5 ,解决 Sorting it all out 问题 。 


1 int main { 


2 int n,m; 

3 FILE * fl, * f2; 

4  assert(f1— fopen("chapl0/SortingItAllOut/inputdata., txt" ,"r")) ; 

5 assert({2=fopen("chap10/SortingItAllOut/outputdata. txt" ,"w")) ; 

6 fscanf(f1,"%d%d",&n,&-m); /* 读 取 案 例 中 对 象 个 数 n 及 关系 数 m* / 
7 while(n|| m){ 

8 Graph * g=trivialGraph(n) ; / * 创建 n 个 顶点 的 零 树 * / 

9 char line[ 4]; 


10 pair p={NULL,NULL}; 


11 int u,v,i=0,count=0,success=0,failed=100, 

12 * accessed= (int * ) calloc(n, sizeof (int) ) ; /* 顶点 访问 标志 * / 

13 — for(i-l; i<=m; i 十 十 ){ /* 处 理 本 案例 的 每 一 个 关系 * / 
14 ÍscanfCf1, " 6s" line) ; /* 读 取 关系 */ 

15 if(failed< =m) /= 已 经 知道 失败 / 

16 continue; 

17 u—line[ 0]-A'; v= line[ 2]-A' / * 计算 关系 中 对 象 对 应 的 顶点 * / 
18 addEdg(g,u.v.1.0); /* 向 图 中 添加 边 * / 

19 if(p. first) free(p. first); 

20 if(p. second) free(p. second) ; 

21 p=toplogicalSort(g) ; / * 计算 图 的 拓扑 排序 * / 

22 ifC * (Cint * )p. first) ==0) { /* 若是 有 圈 图 ,排序 失败 x*/ 

23 failed—i; 
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24 continue; 

25 ) 

26 ifCaccessed[ u]==0) { /* 计数 访问 过 的 顶点 (对 象 ) * / 
27 accessed[u]=1; 

28 count+ + ; 

29 ) 

30 ifCaccessed[ v]==0) { /* 计数 访问 过 的 顶点 (对 象 ) * / 
31 accessed[ v]=1; 

32 count+ + ; 

34 } 

35 if(count<n) /* 计数 成 功 步骤 * / 

36 success+ +; 

37 } 

38 if(failed<=m) /* 排序 失败 * / 

39 ÍprintfCf2, "Inconsistency found aftter %d relations. Wn" , failed) ; 

40 else if(count<n) { /* 不 能 排序 * / 

41 fprintf(f2,"Sorted sequence cannot be determined. \n") ; 

42  jelse( /* 排序 成 功 * / 

43 int k, * s— Cint * )p. second; 

44 ÍprintfCf2, " Sorted sequence determined after %d relations:",success+ 1); 
45 for(k=0;k<n3k++){ 

46 fputc('A'+s[k] ,{2); 

47 

48 fputc(\n', f2); 

49 ) 


50 ÍreeCaccessed) ;free( p. first) ; free( p. second) ; 
51 fscanf(f1,"%d%d", &n,&-m); 

52 } 

53 fclose(f1) ; fclose({2) ; 

54 return 0; 

55 } 


程序 10-4 解决 Sorting it all out 问题 的 C 程序 


对 程序 10-4 的 说 明 如 下 。 

CD 由 于 输入 文件 含有 若干 个 案例 数据 ,第 7 一 52 行 的 while 循环 依次 处 理 每 个 案例 。 

(2) 对 每 一 个 案例 ,第 8 行 调用 函数 zeroGraph 创建 一 个 零 图 (只 有 顶点 没有 边 的 图 ) 。 
第 12 行 声明 一 个 用 来 标识 顶点 是 否 已 访问 过 的 数组 accessed, 其 中 的 元 素 初始 化 为 0( 注 意 
分 配 存 储 空间 时 调用 的 函数 是 calloc) 。 

G) 第 13 一 37 行 的 for 循环 对 应 算法 过 程 中 第 2 一 10 行 的 操作 ,逐条 处 理 输入 案例 中 
的 每 一 个 关系 。 第 14 行 读 取 关 系 表达 式 ,在 以 前 处 理 的 关系 均 合法 的 前 提 下 (第 15 行 和 第 
16 行 所 做 检测 ) ,第 17 行将 关系 表达 式 中 的 两 个 对 象 分 别 转换 成 对 应 的 图 中 顶点 u 和 vo 
第 18 行 调用 函数 addEdge 将 边 (u,v) 加 入 到 图 g 中 。 第 21 行 调用 函数 toplogicalSort 计算 
图 g 是 否 无 圈 。 对 有 圈 的 情形 ,第 22 一 25 行 负责 记载 失败 步骤 failed。 第 26 一 34 行 根据 数 
组 accessed 跟踪 的 信息 计算 us v 中 未 曾 访问 过 的 顶点 数 . 累 计 于 count 中 。 第 38 一 49 行 实 
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现 算法 中 第 11 一 16 行 的 操作 ,分 情况 向 输出 文件 写 信 相关 信息 。 
程序 存储 在 文件 夹 chap10/Sorting It All Out 中 的 源 文件 sortingitallout. c 中 ,读者 可 
打开 文件 研读 ,并 试 运行 。 


10.2 有 向 图 的 强 连 通 分 支 


10.2.1 算法 描述 与 分 析 


l. 问题 的 理解 与 描述 


现在 来 考虑 深度 优先 搜索 的 另 一 个 经 典 应 用 : 将 一 个 有 向 图 分 解 为 强 连 通 分支 。 本 节 
说 明 如 何 利 用 两 次 深度 优先 搜索 来 做 到 这 一 点 。 很 多 对 有 向 图 的 算法 都 以 这 样 的 分 解 作为 
开头 。 分 解 后 ,算法 分 别 对 每 一 个 强 连通 分 支 运行 。 问 题 的 解 按 各 分 支 间 的 连接 结构 合并 
而 成 。 

有 向 图 G 二 (V,E) 的 一 个 强 连通 分 支 C 是 一 个 使 得 其 中 每 一 对 顶点 u 和 vwv 均 有 u v 
Ko u MG u Alo 是 相互 可 达 的 顶点 集合 C CV. R 10-6 展示 了 一 个 例子 。 

图 10-6(a) 为 一 个 有 向 图 G。G 的 强 连通 分 支 显示 为 阴影 区 域 。 每 一 个 顶点 标示 出 了 
它 的 发 现时 间 和 完成 时 间 。 树 枝 边 也 加 有 阴影 。 图 10-6(b) 为 图 GG 的 转 置 )。 展 示 了 
STRONGLY-CONNECTED-COMPONENTS 的 第 3 行 计算 的 深度 优先 森林 ,树枝 边 也 加 有 阴 
影 。 每 一 个 强 连 通 分 支 对 应 一 棵 深度 优先 树 。 加 了 深 色 阴 影 的 顶点 bc\g 和 h 是 由 对 
GT 进行 深度 优先 搜索 而 产生 的 深度 优先 树 的 根 。 图 10-6(c) 将 G 中 的 各 强 连通 分 支 收缩 
为 单一 顶点 后 得 到 的 分 支 图 。 图 10-6(d) 为 图 G 的 分 支 图 。 

计算 强 连通 分 支 的 问题 形式 化 表示 为 如 下 。 

输入 : 有 向 图 G。 

输出 : G 的 各 强 连通 分 支 {Ci ,C;，… ,Ci})。 

寻求 图 G 王 二 V,E> 的 强 连 通 分 支 的 算法 要 用 到 G 的 转 置 , 它 定 义 于 本 章 的 开头 。 也 
就 是 图 GT ——V. ET. Hep ET— (Q0: Cou) € E}, HI ET 是 由 G 的 所 有 边 的 反 向 而 
得 。 给 定 G 的 一 个 邻接 表 表 示 , 创 建 G7 的 时 间 是 BC(V 十 已 )( 见 算法 10-1 和 算法 10-2), 
有 趣 的 是 G 和 GT 恰 有 相同 的 连通 分 支 : u 和 w EG 中 相互 可 达 当 且 仅 当 它们 在 G7 中 相互 
可 达 。 图 10-6(b) 展 示 了 图 10-6(a) 中 的 图 的 转 置 , 其 中 的 强 连通 分 支 带 有 阴影 。 如 果 把 一 
个 有 向 图 G 中 的 各 个 强 连通 分 支 收缩 为 一 个 “顶点 ”, 则 将 得 到 一 个 称 为 G 的 分 支 图 的 有 向 
Bl. Al 10-6(c) 展 示 了 图 10-6(a) 的 分 支 图 。 很 容易 理解 引 理 10-1. 

引 理 10-1 有 向 图 的 分 支 图 是 一 个 有 向 无 圈 图 。 

这 是 因为 如 果 分 支 图 中 存在 一 个 圈 , 则 该 圈 又 构成 G 的 一 个 更 大 的 连通 分 支 ,此 与 分 
支 图 的 定义 不 符 。 

假定 对 有 向 图 G 做 了 一 次 DFS, 则 每 个 顶点 都 具有 发 现时 间 d[uj 和 完成 时 间 fL] 
KG AIREA Ci Cs Cro XE G 的 分 支 图 中 的 各 个 顶点 (G 的 各 个 强 连通 分 支 Ci， 
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2/7 
5/6 
(d) 


图 10-6 ”有 向 图 G 及 其 转 置 的 分 支 图 


i=1,2, 40 ,定义 发 现时 间 和 完成 时 间 d CC) = minec, (du ]) & fCC) = max;ec, Uf Lu) o 
例如 ,图 10-6(c) 中 各 个 顶点 所 标示 的 发 现时 间 、 完 成 时 间 。 有 趣 的 是 ,分 支 图 中 边 的 方向 
都 是 从 完成 时 间 较 大 的 顶点 指向 完成 时 间 较 小 的 顶点 。 这 不 是 偶然 现象 ,由 引 理 6-4 可 知 ， 
有 向 图 的 分 支 图 是 无 环 的 ,所 以 图 中 顶点 按 完成 时 间 的 降序 恰 为 顶点 的 拓扑 顺序 。 由 此 可 
以 得 到 引 理 10-2, 

31 10-2 iE C 和 C"“ 是 有 向 图 G=(V,E) 的 两 个 不 同 的 强 连通 分 支 。 在 一 次 深度 优 
先 搜索 中 其 完成 时 间 分 别 为 /A(C) 和 (CD. AAW uv) © ET, 其 中 xEC 及 vEC', 则 
FLO HCY. 

例如 ,图 10-6(d) 可 视 为 图 10-6(c) 的 转 置 ,其 实 也 是 图 10-6 (a) 的 转 置 的 分 支 图 。 其 
中 所 有 顶点 旁边 标示 的 是 图 10-6(c) 的 顶点 的 发 现时 间 / 完 成 时 间 ,而 所 有 的 边 都 是 从 完成 
时 间 的 较 大 者 指向 完成 时 间 的 较 小 者 。 


2. 算法 的 伪 代 码 描述 


利用 引 理 10-2, 用 下 列 的 线性 时 间 ( 即 8@(V 十 E) 时 间 ) 算 法 计算 有 向 图 G=CV,E) 的 强 
连通 分 支 , 它 利用 两 次 深度 优先 搜索 ,一 次 对 G, 一 次 对 GT 。 
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STRONGLY-CONNECTED-COMPONENTS(G) 

1 调用 DFS(G) 对 每 个 顶点 计算 fu] 

2 HAG 

3 调用 DFS(G7) ,但 在 DFS 的 主 循环 中 按 (以 在 第 1 行 中 的 计算 )f[w] 的 降序 进行 
4 输出 第 3 步 所 得 的 深度 优先 森林 中 的 每 一 棵 树 中 的 顶点 作为 一 个 强 连 通 分 支 


算法 10-6 计算 有 向 图 的 强 连通 分 支 的 算法 


第 3 步 按 在 第 1 步 中 所 得 的 顶点 的 完成 时 间 降 序 作 为 第 二 次 DFS 的 主 循环 顺序 ,在 进 
入 一 个 连通 分 支 进 行 深度 优先 搜索 .将 完成 该 分 支 中 的 所 有 顶点 的 访问 ,形成 一 棵 深度 优先 
树 。 根 据 引 理 10-2, 此 次 搜索 不 会 进入 另 一 个 强 连通 分 支 ,因为 完成 时 间 较 大 的 分 支 在 分 
支 图 中 没有 指向 完成 时 间 较 小 的 分 支 。 所 以 完成 一 个 分 支 的 搜索 后 , 主 循环 会 进入 下 一 轮 
重复 ,进行 另 一 个 分 支 的 搜索 ,形成 又 一 棵 深度 优先 树 ，…… 。 第 4 步 将 对 应 强 连通 分 支 的 
搜索 树 中 顶点 输出 刚好 得 到 每 个 分 支 。 

从 上 述说 明 中 可 见 ,STRONGLY-CONNECTED-COMPONENTS 过 程 中 调用 的 DFS 需要 
做 一 点 修改 : 使 它 能 够 按照 一 定 的 顺序 执行 主 循环 。 

DFS-By-ORDER(G, order) 

1 for each vertex uE V[G] 

2 do color[u]-- WHITE 

3 n[u]«-NIL 

4S<@ 

5 m<|V[G]| 

6 for s<-1 to V[G] 

7  doifcolor[order[s]]— WHITE 

8 then color[order( 5] ]4 GRAY 


9 PUSH(S,order[s]) 

10 while SAZ 

11 do x<-TOP(S) 

12 if 3v€ Adj[u] and color[v]=WHITE 
13 then color[ v]--GRAY 

14 n[v]-—u 

15 PUSH(S,v) 

16 else color u]- BLACK 

17 tof-logic[ m]*-u.m*-m—1 

18 Pop(S) 


19 return x and top-logic 
算法 10-7 按 指定 顺序 进行 主 循环 的 DFS 算法 


与 DFS 相 比 ,DFS-BY-ORDER 多 了 一 个 指示 访问 顶点 顺序 的 数组 order 作为 参数 ,其 
中 的 元 素 是 1,2,…,n 的 一 个 排列 。 第 6 一 19 行 的 主 循环 for 的 重复 顺序 为 order[1]， 
order[2],… -order[n]. 

介 于 第 9 行 和 第 17 行 之 间 的 代码 与 算法 10-4 的 基本 一 致 ,只 是 删除 对 无 圈 图 标志 
acyclicity 的 操作 。 第 18 行将 计算 所 得 的 数组 x、top-logic 返回 。 
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3. 强 连通 分 支 的 输出 


为 了 能 根据 对 GT 运行 DFS-BY-ORDER 返回 的 数组 «输出 G 的 各 个 强 连通 分 支 ,给 出 
如 下 代码 。 


MAKE-FORESTCr) 

1 n-—length[x] 

2 forest--() 

3 for s<-1 ton 

4  doif x[s]=NIL 
5 then ree {s} 

6 for vl to n 

7 do if IS-ROOTCz s) 
8 then add v to tree 
9 add tree to forest 

10 return forest 


算法 10-8 ”根据 数组 创建 深度 优先 森林 的 过 程 
过 程 MAKE-FOREST 运行 如 下 。 第 3 一 9 行 的 for 循环 扫描 数组 x 中 的 树 根 结 点 ; ,一 
个 根 结 点 ,确定 森林 中 一 棵 树 。 内 和 嵌 的 第 6 一 8 行 的 for 循环 对 每 个 顶点 "检测 是 否 在 以 
s 为 根 的 树 中 ,若是 , 则 将 加 入 树 中 。 第 9 行将 以 forest 


s 为 根 的 树 加 入 到 森林 中 。 可 以 用 嵌 套 的 链表 来 组 织 po 
MAKE-FOREST 返回 的 数据 forest WLP 10-7) 。 -cd-[4 

过 程 中 第 7 行 用 来 测试 顶点 * 是 否 为 v 的 根 的 t Flaps mem 
Is-ROOT 过 程 的 伪 代 码 如 下 。 i ] 

Is-ROOT(x,5,v) viis 

lifs—v 图 10-7 将 MAKE-FOREST 返回 的 

2 then return true BOE A 2A Ae dp E 


3 if x[ v]— NIL 
4 then return false 


5 return Is-ROOTGe ss z[ v] 
算法 10-9 检测 顶点 s 是 否 为 顶点 v 的 根 的 过 程 


本 过 程 用 递归 的 方式 判断 * 到 wv 是 否 构 成 搜索 树 中 的 一 条 路 径 。 由 于 IS-ROOT 至 多 递 
归 n 次 ,所 以 它 的 时 间 复 杂 度 为 6(n)。 于 是 .过 程 PRINT-COMPONENTS 的 时 间 复 杂 度 为 
m * GG) Hp om 是 森林 中 的 搜索 树 数 。 

利用 DFS-BY-ORDER、TRANSPOSE-DIRECTED-GRAPH 和 MAKE-FOREST, 将 STRONGLY- 
CONNECTED-COMPONENTS 重 写 如 下 。 


STRONGLY-CONNECTED-COMPONENTS(G) 
1 for u<-1 ton 
2 doorder[u]-u 
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3 order< 调用 DFS-By-ORDER (G,order) 返 回 的 top-logic 数组 
4 G™<-TRANSPOSE-DIRECTED-GRAPH (G) 

5 r< -调用 DFS-BY-ORDER (G' ,order) 返 回 的 x 数组 

6 return MAKE-FOREST (x) 


算法 10-10 重 写 过 程 STRONGLY-CONNECTED-COMPONENTS 


10.2.2 程序 实现 


由 于 算法 是 基于 DFS 的 ,所 以 对 程序 10-2 中 定义 的 函数 dfs 稍 做 修改 就 可 以 实现 能 按 
照 指 定 顺序 执行 主 循环 的 DFS-BY-ORDER 算法 。 


1 pair dísByOrder(Graph * g,int * order){ 

2 Stack * S= createStack(sizeof int) ) ; 

3 int usssn=g->n,v»m=n, 

4 * pi= (int * )malloc(n * sizeof(int)) , 

5 * topLogic= (int * ) malloc(n * sizeof(int) ) ; 

6 Color * color= (Color * )malloc(n * sizeof(Color)) ; 

7 ListNode **pos= (ListNode**) malloc(n * sizeof( ListNode * )); 
9 for(u-0;u-n;ud- +){ 


10 piLu]7 —1; 

11 color[u] - WHITE; 

12 pos[u]— g-»adj[ u]-»nil-»next; 

13 ) 

14 for(s=0;s<n;s 十 十){ 

15 if(color[order[s]]= =WHITE){ 

16 color[order[s]]=GRAY; 

17 push(S, &-order[s]); 

18 while( !stackEmpty(S)) { 

19 ListNode * p; 

20 u= * (int * )(S->top->key); 

21 p=posLu]; 

22 v=(p!=g->adjLu]—>nil)? ((vertex * )(p->key) )->index: —1; 
23 while( p! = g-»adj[ u]-»nil&-&color[ v]! WHITE) { 
24 p=p->next; 

25 v=(p!=g->adjLu]->nil)? ((vertex * )(p->key)) ->index: —1; 
26 j 

27 pos[u]=p; 

28 if(pos[u]!=g->adj[u]->nil) { 

29 color[v]=GRAY; 

30 pilv]=u; 

31 push(S, &-v); 

32 }else{ 

33 color[u]=BLACK; 

34 topLogic[--m]=u; 
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35 pop(S); 


39 ) 

40 free(pos) ;free(color) ; 

41 return make_pair( pi, topLogic) ; 
42] 


程序 10-5 ”实现 按 指定 主 循环 重复 顺序 的 DFS 算法 10-7 的 C 源 代 码 
程序 10-5 的 代码 与 程序 10-3 十 分 相近 ,删除 无 圈 图 标志 的 操作 ,保留 数组 pi, 并 作为 
返回 数据 之 一 。 读 者 可 比较 研读 ,在 此 不 再 袭 述 。 
在 计算 有 向 图 强 连通 分 支 的 算法 中 需要 计算 图 G 的 转 置 G ,这 个 过 程 定义 于 本 章 开 头 
的 算法 10-2 中 ,在 C 语 言 中 把 它 实 现 为 一 个 函数 。 


1 Graph * transpose(Graph * g){ 


2 Graph * gt— (Graph * ) malloc(sizeof( Graph)) ; 

3 int u,v.n—gt-»n—g-^n; 

4 gt-»adj— (LinkedList**) malloc(n * sizeof( LinkedList)) ; 

5 for(u—-0;u-n;ud- +) 

6 gt-»adj[ u]— createList(sizeof( vertex) , NULL) ; 

党 for(u=0;u<n;u++){ 

8 ListNode * i—g-»adj[ u]-»nil-»next; /*g 的 顶点 u 的 邻接 表 指针 */ 
9 whileCi! 一 g->adj[u]->nilD{ /* 在 u 的 邻接 表 扫 描 */ 
10 vertex * ul=(vertex * ) malloc(sizeof( vertex) ) ; 

11 v=((vertex * )(i->key))->index; /* uv 邻接 */ 

12 ul-»index— u; 

13 ul-»weight— ((vertex * )(i-»key)) -» weight; 

14 listPushFront(gt-»adj[ v] uD ; 

15 i—i-»next; 

16 ) 

17 ) 

18 return gt; 

19 } 


程序 10-6 ”实现 计算 图 的 转 置 的 算法 10-2 的 C 源 代码 


对 程序 10-6 的 说 明 如 下 。 

(1) 函数 transpose 只 有 一 个 参数 : 图 G 的 邻接 表 表示 g。 它 将 返回 G 的 转 置 G7 的 邻 
接 表 表 示 gt。 

(2) 第 2 一 6 行为 图 g 的 转 置 图 gt 分 配 空 间 。 其 顶点 数 与 图 g 的 顶点 数 相同 。 

G) 第 7 一 17 行 实现 的 是 算法 10-2 中 的 第 3 一 5 行 的 操作 : 根据 G 中 的 边 (u,v) 在 
GT 中 插入 边 (v,u)。 具 体 地 说 ,就 是 找到 G 中 顶点 的 邻接 表 中 的 顶点 v, 然 后 在 GT 的 顶 
点 v 的 邻接 表 中 加 入 顶点 。 

为 便于 代码 重用 ,把 程序 10-6 添加 到 文件 夹 graph 中 的 头 文件 graph. h( 原 型 声明 ) 及 
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源 文件 graph. c( 定 义 代码 ) 文 件 中 。 
做 好 这 些 准 备 后 ,就 可 以 把 STRONGLY-CONNECTED-COMPONENTS 过 程 实现 为 下 列 
函数 。 


1 int isRoot(int * pi,int s,int v){ 


2 if(s==v) /* 树 根本 身 * / 

3 return 1; 

4  if(p[v]-——D /* 另 一 棵 树 的 根 */ 
5 return 0; 

6 return isRoot(pi,s,pilv]); /* 递归 检测 父 结 点 * / 


7} 
8 LinkedList * makeForest(int * pi,int n){ 
9 LinkedList * forest— createList(sizeof( LinkedList * ), NULL); 


10 ints.v; 

11 for(s—0O;s-nisd- 4l 

12 if(pi[s]- —— Dt / * 是 一 棵 树 的 根 * / 
13 LinkedList * tree 一 createList(sizeof(int) , NULL) ; 

14 for(v=0;v<n3v+ +) /* 存储 树 中 的 结 点 * / 
15 if(isRoot(piysyv)) 

16 listPushBack(tree, &-v) ; 

17 listPushBack( forest, & tree) ; 

18 ) 

19 } 

20 return forest; 

21) 


22 LinkedList * strongConnectedComponents(Graph * g)( 
23 int n=g->n.-u; 

24 pair r; 

25 int * pi, * order= (int * )malloc(n * sizeofCint)) ; 
26 LinkedList * forest; 

27 Graph * gt; 

28 for(u=0;u<n;u 二 十 ) 

29 order[u]=u; 

30 gt— transpose(g) ; 

31 r— dfsByOrder(g. order) ; 

32 free(r. first) sfreeCorder) ; 

33 order= (int * ) Cr. second) ; 

34 r— dísByOrder( gt. order) ; 

35 graphClear(gt) ; free( gt) ; 

36 pi= (int * )(r. first) ;free(r. second) ;freeCorder) ; 
37 Torest— makeForest( pi. n) ; 

38 free(pi ; 

39 return forest; 


EF 10-7 实现 算法 10-8 一 算法 10-10 的 C BRB 
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对 程序 10-7 的 说 明 如 下 。 

COD 第 1 一 7 行 定义 的 函数 isRoot 实现 的 是 算法 10-9 ISROOT。 代 码 与 算法 的 伪 代 码 
几乎 一 致 ,在 此 不 再 著述 。 

(2) 第 8 一 21 行 定 义 的 函数 makeForest 实现 的 是 算法 10-8 MAKE-FOREST。 除 了 参 
数 多 了 一 个 说 明 图 的 顶点 数 的 nn 以 外 ,实现 代码 也 是 十 分 直接 的 。 要 注意 的 是 ,第 9 行将 
forest 声明 为 LinkedList 型 指针 ,而 第 13 行将 tree 也 声明 成 LinkedList 型 指针 。 当 
第 14 一 16 行将 以 s 为 根 的 深度 优先 树 中 的 所 有 结 点 加 入 到 tree 中 后 ,第 17 行将 tree dfi 
入 到 forest 中 。 

(3) 第 22 — 40 行 定 义 的 函数 strongConnectedComponents 实现 的 是 算法 10-10 
STRONGLY-CONNECTED-COMPONENTS。 第 31 行 调用 dfsByOrder 函数 按 在 第 28 行 和 第 
29 行 初始 化 为 自然 顺序 的 order 对 g 做 DFS。 第 33 行将 封装 在 返回 结果 r 中 的 拓扑 顺序 
数组 topLogic 赋予 order。 第 34 行 对 gt 调用 dfsByOrder 按 g 的 拓扑 顺序 order 做 DFS, 
第 36 行将 封装 在 返回 结果 r 中 的 父 结 点 指针 数组 赋予 数组 pi, 第 37 行 调用 makeForest it 
算出 由 强 连通 分 支 组 成 的 深度 优先 森林 forest, 第 39 行将 其 返回 。 

为 便于 代码 重用 ,将 程序 10-6 添加 到 文件 graph. h 和 graph. c 中 ,而 将 程序 10-5, f 
Vr. 10-7 存储 在 文件 夹 graph 中 的 文件 scc. h 和 sec. c (P. 


10.2.3 应 用 一 一 亲情 号 


Quote Calling Circles 


Description 

If you've seen television commercials for long-distance phone companies lately.you've 
noticed that many companies have been spending a lot of money trying to convince people 
that they provide the best service at the lowest cost. One company has "quotcalling 
circles, " You provide a list of people that you call most frequently. If you call someone in 
your calling circle (who is also a customer of the same company). you get bigger discounts 
than if you call outside your circle. Another company points out that you only get the big 
discounts for people in your calling circle.and if you change who you call most frequently. 
it's up to you to add them to your calling circle. 

LibertyBell Phone Co. is a new company that thinks they have the calling plan that 
can put other companies out of business. LibertyBell has calling circles, but they figure out 
your calling circle for you. This is how it works. LibertyBell keeps track of all phone 
calls. In addition to yourself. your calling circle consists of all people whom you call and 
who call you.either directly or indirectly. For example.if Ben calls Alexander. Alexander 
calls Dolly. and Dolly calls Ben. they are all within the same circle. If Dolly also calls 
Benedict and Benedict calls Dolly.then Benedict is in the same calling circle as Dolly.Ben. 
and Alexander. Finally.if Alexander calls Aaron but Aaron doesn't call Alexander. Ben. 


Dolly ,or Benedict.then Aaron is not in the circle. 
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You've been hired by LibertyBell to write the program to determine calling circles 
given a log of phone calls between people. 

Input 

The input file will contain one or more data sets. Each data set begins with a line 
containing two integers.n and m. The first integer. n.represents the number of different 
people who are in the data set. The maximum value for n is 25. The remainder of the data 
set consists of m lines, each representing a phone call. Each call is represented by two 
names, separated by a single space. Names are first names only (unique within a data set), 
are case sensitive. and consist of only alphabetic characters; no name is longer than 25 
letters. For example.if Ben called Dolly.it would be represented in the data file as 

Ben Dolly 

Input is terminated by values of zero (0) for n and m. 

Output 

For each input set. print a header line with the data set number, followed by a line for 
each calling circle in that data set. Each calling circle line contains the names of all the 
people in any order within the circle. separated by comma-space (a comma followed by a 
space). Output sets are separated by blank lines. 


Sample Input 


56 

Ben Alexander 
Alexander Dolly 
Dolly Ben 

Dolly Benedict 
Benedict Dolly 
Alexander Aaron 
14 34 

John Aaron 
Aaron Benedict 
Betsy John 

Betsy Ringo 
Ringo Dolly 
Benedict Paul 
John Betsy 

John Aaron 
Benedict George 
Dolly Ringo 

Paul Martha 
George Ben 
Alexander George 
Betsy Ringo 
Alexander Stephen 
Martha Stephen 
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Benedict Alexander 
Stephen Paul 
Betsy Ringo 
Quincy Martha 
Ben Patrick 
Betsy Ringo 
Patrick Stephen 
Paul Alexander 
Patrick Ben 
Stephen Quincy 
Ringo Betsy 
Betsy Benedict 
Betsy Benedict 
Betsy Benedict 
Betsy Benedict 
Betsy Benedict 
Betsy Benedict 
Quincy Martha 
00 


Sample Output 


Calling circles for data set 1; 
Ben, Alexander. Dolly, Benedict 
Aaron 


Calling circles for data set 2; 

John, Betsy, Ringo, Dolly 

Aaron 

Benedict 

Paul, George, Martha, Ben, Alexander, Stephen, Quincy Patrick 


l. 问题 描述 与 分 析 


本 题 是 要 求 根 据 通信 客户 间 相 互通 信 ( 包 括 直接 的 和 间接 的 双向 通信 ?的 关系 来 确定 这 
样 的 客户 群 。 例 如 , 若 Ben 打 电话 给 Alexander, Alexander 打 电 话 给 Dolly,Dolly 打 电 话 给 
Ben, 那 么 他 们 就 属于 一 个 客户 群 。 如 果 Dolly 还 打 电 话 给 Benedict H. Benedict 打 电 话 给 
Dolly, 则 Benedict 也 和 Dolly, Ben 及 Alexander 一 样 属于 该 客户 群 。 然 而 , 若 Alexander 打 
电话 给 Aaron ,但 Aaron 并 不 给 Alexander, Ben, Dolly 及 Benedict, W) Aaron 并 不 属于 该 客 
户 群 。 移 动 电话 公司 将 对 这 样 的 客户 群 施 以 资费 优惠 。 如 果 把 通信 客户 抽象 为 一 个 点 , 客 
户 间 的 呼叫 关系 抽象 为 有 向 边 , 则 一 个 输入 实例 就 构成 一 个 有 向 图 。 题目 实 际 上 是 要 求 计 
算 图 的 强 连通 分 支 ,对 每 个 分 支 内 的 用 户 给 予 优 惠 。 所 以 ,调用 STRONGLY-CONNECTED- 
COMPONENTS 就 能 解决 Quote Calling Circle 问题 。 


2. 程序 实现 
1 int find(char **name,char * s,int index) { 
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7} 


inti; 
for(i=0;i<index;it+ +) 
if(stremp(name[i],s)==0) 
return i; 


return —1; 


8 int mainO { 


9 

10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 


int n,m,count=0; 
FILE * fl, * f2; 
assert(f1— fopen("chap10/Quote calling circles/inputdata, txt" ,"r")) ; 
assert({2=fopen("chap10/Quote calling circles/outputdata. txt" ,"w")); 
fscanf({1,"%d%d",&n,&m); 
while(n || m) { 
int i,index=0; 
Graph * g=zeroGraph(n) ; 
LinkedList * forest; 
ListNode * p; 
char **name= Cchar**) malloc(n * sizeof( char * )) ; 
for(assert(name) ,i=0;i<n;i 十 十) 
name[i]= (char * )calloc(26 ,sizeof (char)) ; 
for(i=0;i<m;i++){ 
char A[26].B[ 26]; 
int u,v,k; 
fscanf(f1,"%s%s",A,B); 
k=find(name, A, index) ; 
if(k==—1){ 
u— index; 
strepy(name[index++],A); 
}else{ 
u=k; 
} 
k=find(name, B, index) ; 
if(k==—1){ 
v=index; 
strepy(name[index++ ]. B) ; 
Jelset 
v=k; 
) 
addEdge(g.u,v.1.0); 
} 
forest=strongConnectedComponents( g) ; 
fprintf({2,"Calling circles for data set %d:\n" , ++count); 
p= forest-»nil-»next; 


while(p! —forest-»niD { 
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46 LinkedList * tree— * ((LinkedList**) p->key) ; 
47 ListNode * q— tree-»nil-»next; 
48 while(q! = tree->nil) ( 

49 int u= * (Cint * )q—>key); 
50 fprintf({2,"%s ",nameLu]); 
51 q=q->next; 

52 ) 

53 Íputc(^n' f2); 

54 clrList(tree, NULL) ;free(tree); 
55 p=p->next; 

56 } 


57 clrList(forest, NULL) ; free( forest) ; 
58 fprintf{(f2,"\n"); 
59 for(i=0;i<n;it++) 


60 free(nameLi]) ; 

61 free(name) ; 

62 fscanf(f1,"%d%d",&n,&-m); 
63 } 


64 fclose(fl) ; fclose({2) ; 
65 return 0; 
66 ) 


程序 10-8 fH Quote Calling Circle 问题 的 C 程序 


对 程 10-8 的 说 明 如 下 。 

CD. 第 14 一 63 行 的 while 循环 处 理 输入 文件 中 的 每 一 个 案例 。 其 中 ,第 16 行 声明 了 一 
个 零 图 g。 第 17 行 声明 了 一 个 链表 forest, 用 来 存储 g 的 强 连 通 分 支 。 第 19 一 21 行 声 明了 
一 个 字符 串 数组 name, 用 来 存放 用 户 的 名 字 。 

(2) 第 22—41 行 的 for 循环 逐一 读 取 输入 文件 中 案例 数据 的 每 一 条 通话 信息 ,并 将 其 
转换 成 有 向 图 。 其 中 ,第 25 行将 两 个 通话 用 户 名 字 读 取 到 串 A 和 B, 第 26 一 32 行 检验 A 是 
否 曾经 出 现 过 (第 26 行 调用 函数 find 在 数组 name 中 查找 ,该 函数 定义 在 第 1 一 7 行 ) , 若 未 
曾 出 现 过 , 则 将 其 存放 在 name 的 index 位 置 上 (index 声明 于 第 15 行 ,初始 化 为 0, 表示 新 
的 用 户 名 字 插 入 到 name 中 的 位 置 ) ,对 应 的 图 中 的 顶点 u 为 index, I, u W A E name 
中 的 位 置 。 第 33 一 39 行 用 同样 的 方式 处 理 用 户 名 B, 并 确定 对 应 的 图 中 顶点 v。 第 40 行将 
边 (u,v) 插 入 到 图 g 中 。 第 42 行 调用 函数 strongConnectedComponents 计算 g 的 强 连通 分 
支 ,结果 返回 给 forest. 

(3) 第 45~56 行 的 while 循环 向 输出 文件 写 入 forest 中 的 每 一 棵 树 ( 对 应 g 的 一 个 强 
连通 分 支 )。 其 中 ,第 48 一 52 FFAS AL HK while 循环 将 当前 树 中 的 每 个 结 点 对 应 的 用 户 名 字 
写 入 输出 文件 。 

程序 10-8 存储 在 文件 夹 chap10/Quote Calling Circle 中 的 源 文件 QuoteCallingCircle. c 中 ， 
读者 可 打开 研读 ,并 试 运行 。 
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10.3 无 向 图 的 双 连 通 分 支 


10.3.1 算法 描述 与 分 析 


1. 问题 的 理解 与 描述 


设 G=(V,E) 是 一 个 连通 无 向 图 。G 的 一 个 关节 点 是 移 除 该 点 将 导致 该 图 不 连通 的 项 
点 。G 的 一 座 桥 (Bridge) 是 G 的 一 条 边 , 移 除 该 边 将 导致 G 不 连通 。G 的 一 个 双 连 通 分 支 
是 一 个 边 的 最 大 集合 ,其 中 的 任意 两 条 边 都 同 在 一 条 简单 环 路 上 。 图 10-8 给 出 了 这 些 定义 
的 示例 。 可 以 利用 深度 优先 搜索 来 确定 关节 点 、 桥 和 双 连 通 分 支 。 设 G= (V, E) iÈ G W 
一 棵 深度 优先 树 。 


图 10-8 ”连通 无 向 图 的 关节 点 , 桥 和 双 连 通 分 支 


图 10-8 所 示 为 连通 无 向 图 的 关节 点 、 桥 和 双 连 通 分 支 。 关 节点 加 了 深 色 阴影 , 桥 也 加 
上 了 深 色 阴 影 , 双 连通 分 支 是 阴影 区 域 中 的 边 , 并 加 以 编号 。 

显然 ,没有 关节 点 的 图 G 是 双 连 通 图 。 若 两 个 关节 点 uo 之 间 存 在 G 的 边 (u,v), 则 
(u,v) 就 是 G 的 一 座 桥 。 删 除 所 有 的 桥 ,得 到 的 G 的 子 图 构成 G 的 双 连 通 分 支 。 所 以 ,计算 
图 的 关节 点 是 一 个 关键 问题 ,把 它 形式 化 为 如 下 。 

输入 : 无 向 连通 图 G.G 中 一 个 顶点 s 作为 源 顶 点 。 

输出 : 若 G 有 关节 点 ,返回 G 的 关节 点 构成 的 集合 A ,否则 返回 空 集 。 


2. 关节 点 在 DFS 过 程 中 的 性 质 


下 面 用 一 个 简单 的 例子 来 说 明 关节 点 在 DFS 过 程 中 的 特性 ,并 由 此 来 设计 一 个 利用 对 
无 向 连通 图 的 DFS 查找 关节 点 的 算法 。 在 图 10-9 中 ,图 10-9(a) 所 表示 的 无 向 连通 图 具有 
cbg Ah 4 个 关节 点 (标示 为 灰色 )。 图 10-9(b) 和 图 10-9(c) 都 是 对 图 10-9(a) 中 的 图 进 
行 DFS 后 形成 的 搜索 树 , 结 点 以 4d/ 了 标示 发 现时 间 和 完成 时 间 。 图 10-9(b) 的 源 顶 点 是 5， 
图 10-9(c) 的 源 顶 点 是 a。 在 这 两 棵 深度 优先 树 中 ,我 们 观察 到 : 

CD 如 果树 根 是 图 中 的 一 个 关节 点 , 则 它 有 多 于 一 个 孩子 (图 10-9(b) 中 的 情形 )。 

(2) 如 果树 中 的 一 个 非 根 结 点 o 是 图 中 的 一 个 关节 点 , 则 该 结 点 必 不 存在 一 个 孩子 结 
点 中, 它 有 一 条 指向 vv 的 父亲 的 回 边 。 

为 了 使 DFS 过 程 能 跟踪 顶点 是 否 具有 关节 点 的 性 质 ,定义 深度 优先 树 中 结 点 v 的 


494 


第 10 章 图 的 搜索 算法 


图 10-9 关节 点 在 深度 优先 树 中 的 特性 


属性 : 

d[v] 

low[v] = min 4d[u] Cou) 为 一 条 回 边 (10-2) 

low[w] witv 的 孩子 
对 一 个 非 根 结 点 wv 而 言 ,如 果 有 它 的 孩子 ww WR PE Lowe lw IAD FE HY AMT do], BU XE 
味 着 v 不 存在 后 代 有 指向 o 的 前 辈 的 回 边 。 这 样 ,就 可 判断 o 就 是 图 中 的 一 个 关节 点 。 按 
结 点 的 Low 属性 定义 ,将 图 10-9(c) 中 的 深度 优先 树 中 各 结 点 的 Low 属性 值 添加 在 发 现时 
间 / 完 成 时 间 标 示 之 后 ,这 样 每 个 结 点 就 有 标示 : d / f low. WE 10-10 所 示 。 注 意 , 树 中 结 
点 5 有 孩子 c 的 low 属性 值 3 大 于 4。 的 发 现时 间 2,65 恰 为 图 中 一 个 关节 点 。 同 样 ,关节 点 c 
有 孩子 结 点 d 的 low 属性 不 小 于 c 的 发 现时 间 。 此 


外 ,关节 点 g 和 也 是 如 此 。 建 议 读者 对 图 10-909. I7 
的 深度 优先 树 中 的 各 个 结 点 标示 出 low 属性 值 。 2/19,1 
3. 算法 的 伪 代 码 描述 3/83 


Qi 
有 了 对 无 向 连通 图 中 关节 点 的 上 述 观 察 ,来 设计 473 


一 个 基于 DES 的 计算 无 向 连通 图 的 关节 点 的 算法 。 @ nns 
5/6,3 1 
ARTICULATION(G,s) ©) | 12/15,11 
1 for each vertex uE V[G] P 
13/14,11 
2 do color[u]-- WHITE © 
3 nlu]-NIL 图 10-10 图 10-9(c) 的 深度 优先 树 
4 time--rootdegree--0 中 各 结 点 的 low 属性 
5 A-—-S-—( 
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6 colorLs]-- GRAY 
7 lowLs]*-dLs]*-time-—time--1 
8 PUSH(S,s) 


9 while SAZ 

10 do u--TOPCS) 

11 for each v€ Adj[u] and color[v]=GRAY 

12 do low[u]=min{low[u],d[v]} 

13 if 3v€ Adj[u] and color[v]= WHITE 
14 then color[ v]--GRAY 

15 [vu 

16 low[v]<—d[v]<time<-timet 1 

17 ifu=s 

18 then rootdegree-*-rootdegree-- 1 
19 PUSH(S,v) 

20 else color[u]-- BLACK 

21 Pop(S) 


22 for v--1 to n 

23 do if x[v] ANIL D IERTA 

24 then if low[ x[ v]]7 Low v] 

25 then Zo: xl v]]<lowlv] 
26 if rootdegree>1 

27 then 将 s 插 入 AP> 根 结 点 是 关节 点 

28 for x< 1l to n 

29 do if xLul#s 


30 then if JowluJ>d[x [u]] 
31 then 将 x [wj 插入 A D AERA AR x [uj 是 关节 点 
32 return A 


算法 10-11 计算 无 向 连通 图 的 关节 点 的 算法 


在 此 过 程 中 ,需要 计算 每 个 顶点 的 low 属性 ,而 low 属性 需要 根据 发 现时 间 d 和 项 
点 间 的 父子 关系 x 来 计算 。 注 意 ,实际 上 顶点 的 发 现时 间 和 完成 时 间 没 有 计算 上 的 关系 ， 
所 以 可 以 省 略 完成 时 间 而 不 影响 发 现时 间 和 Zoo 属性 的 计算 。 

由 于 已 知 G 是 连通 的 , 且 指定 了 源 顶 点 *, 所 以 .可 以 省 略 一 般 的 DFS 中 的 主 循环 。 第 
6 行 和 第 7 行将 s 的 颜色 发 现时 间 和 low 属性 初始 化 后 ,第 8 行将 其 压 栈 。 第 9 一 21 行 的 
while 循环 完成 对 G ff] DFS。 

对 每 一 个 顶点 v, 压 栈 时 将 属性 low[Lv] 初 始 化 为 发 现时 间 dL[vj( 见 第 7 行 和 第 16 行 )。 
在 搜索 的 邻接 表 过 程 中 ,一 旦 发 现 一 条 回 边 ( 我 们 知道 ,在 无 向 图 中 ,除了 树枝 边 只 有 回 
339) Cu o) ,就 将 1oro[ 四 置 为 low[uj] 和 d[vj] 的 较 小 者 ( 见 第 11 行 和 第 12 行 )。 在 完成 深 
度 优先 搜索 后 ,第 22 一 25 行 利用 计算 所 得 的 «(深度 优先 树 中 结 点 间 的 父子 关系 ) 数 组 , 检 
测 各 顶点 v( 二 x[uj) 与 其 孩子 顶点 之 间 low 属性 大 小 ,将 较 小 者 赋予 low[Luj]。 这 样 ,对 
于 每 一 个 顶点 ,都 按 式 (10-2) 计 算 了 它 的 low 属性 。 


Q 见 本 章 10.1.3 节 的 相关 讨论 。 
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对 于 源 顶 点 s, 它 作为 优先 树 的 根 结 点 ,一 旦 发 现 它 有 一 棵 非 空子 树 ,就 将 其 子 树 计数 
器 rootdegree 增加 1( 见 第 17 行 和 第 18 行 )。 

如 果 根 结 点 有 多 于 1 棵 子 树 , 则 它 是 一 个 关节 点 (第 26 行 和 第 27 行 )。 对 于 非 根 结 点 
v, 第 28—31 行 检测 是 否 有 它 的 孩子 结 点 使 得 low[uj 宇 dL[vj, 若 是 , 则 vw 为 一 个 关节 点 。 

由 于 过 程 ARTICULATION 是 基于 DFS 的 计算 无 向 连通 图 的 关节 点 ,所 以 其 时 间 复 杂 
HERI DFS 的 一 样 ,为 @(V 十 E)。 


10.3.2 程序 实现 


下 面 在 C 语言 中 实现 计算 无 向 连通 图 的 关节 点 算法 。 


1 LinkedList * articPoint(Graph * g.int s)( 


2 
3 
4 
5 
6 
7 
8 
9 


Stack * S=createStack(sizeof (int)); 
int n=g->n,u,v,time=0,rootDegree=0; 
Color * color= (Color * ) malloc(sizeof(Color)) ; 
int * pi= (int * ) malloc(n * sizeofCinD) , 
* d= Cint * )malloc(n * sizeofCint)) , 
* low (int * )malloc(n * sizeof(int) ) ; 
LinkedList * a=createList(sizeof(int) , NULL); 
ListNode **pos= (ListNode**) malloc(n * sizeof( ListNode * )) ; 


10 for(u=0;u<n;u++){ 


11 
12 
13 
14 
15 


pi[u]— —1; 
color[ u] 7 WHITE; 


posLu] — g-»adj[u]-»nil-» next; 


color[ s] - GRAY; 
low[s]— d[s]— ++ time; 
push(S, 8.) ; 
while( !stackEmpty(S)) { 
ListNode * ps 
u= * (int * )(S->top->key) ; 
p= pos u]; 


v—(pl—g-»adj[u]-»niD? (vertex * )(p-5key)) -» index; —1; 


while(p! —g-»adj[ u]-»nil&-&-color[ v]! — WHITE) ( 


if(pilu]!=v){ /* 回 边 */ 


if(low[u]>d[Lv]) 
low[u]=d[v]; 
) 


p=p->next; 


v—(p!—g-»adj[u]-»niD? ((vertex * )(p->key))—>index: —1; 


} 


posLu]— p; 
ifC posu]! — g-»adj[ u]-»niD ( / * 找到 白色 顶点 v 并 将 其 压 人 栈 S* / 
if(u==s) /* u ER> / 
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34 
35 
36 
37 
38 
39 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 ) 


rootDegree-- +; 
color[ v] - GRAY; 
low[v]—d[v]— ++ time; 
pilv]=u; 
push(S, &v); 
}else{ 
color[u]=BLACK; 
pop(S); 
} 
} 
for(u=0;u<n;u 二 十 ){ 
if(pilu]!=—1) 
if(low[piLu]]>lowLu]) 
low[pilu]]=lowLu]; 
} 
if(rootDegree>1) 
listPushBack(a, &-s) ; 
for(u=0;u<nsut++){ 
if(piLu]!=s&&pilu]!=—D{ 
if(owLu]>=d[pilu]]) 
listPushBack(a, pi+u) ; 


return a; 


/* 否则 没有 与 u 邻接 的 顶点 , 则 完成 对 u 的 访问 * / 


程序 10-9 实现 计算 无 向 连通 图 的 关节 点 的 算法 10-11 的 C 源 代码 


由 于 在 无 向 图 中 进行 DFS 所 生成 的 深度 优先 树 中 除了 树枝 边 就 是 回 边 ,所 以 第 23 一 
30 行 对 顶点 u 的 邻接 表 扫 描 时 ,只 要 没 遇 到 树枝 边 , 贡 到 的 就 可 能 是 回 边 ( 扫 描 到 的 顶点 
v 是 灰色 的 )。 但 是 ,即使 相 邻 顶点 o 是 灰色 的 , (u,v) 也 未 必 是 一 条 回 边 : 在 无 向 图 中 ， 
(us,v) 和 (wv,w) 是 同一 条 边 , 如 果 这 条 边 是 按 v 到 顺序 首次 被 访问 到 ,那么 ,从 再 次 遇 到 
v,(usv) 就 不 是 一 条 回 边 。 所 以 ,对 于 扫描 到 灰色 顶点 只 有 满足 xu 176v. Cu. 才 是 一 条 
回 边 。 这 就 是 第 24 行 测试 回 边 的 条 件 。 除 此 之 外 ,实现 的 代码 与 算法 的 伪 代 码 十 分 接近 ， 
JH Ah AS FE BER 

把 程序 10-9 的 代码 存储 为 graph 目录 中 的 articpoint. h 和 articpoint. c 文件 ,以 备 重用 。 


10.3.3 应 用 一 一 雌雄 大 盗 


Bonnie and Clyde 


As two icons of the Great Depression. Bonnie and Clyde represent the ultimate 


criminal couple. Stories were written, headlines captured. and films were made about the 


two bank robbers known as Romeo and Juliet in a getaway car. 
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The new generation of Bonnie and Clyde is no longer cold-blooded killers with guns. 
Due to the boom of internet. they turn to online banks and scheme to hack the safety 
system. The safety system consists of number of computers connected by bidirectional 
cables. Since time is limited.they decide that they will attack exactly two computers A and 
B in the network, and as a result. other computers won't be able to transmit messages via A 
and B. The attack is considered successful if there are at least two computers (other than 
A and B) that disconnected after the attack. 

As they want to minimize the risk of being captured.they need to find the easiest way 
to destroy the safety system. However.a brief study of the network indicates that there 
are many ways to achieve their objective; therefore they kidnapped the computer expert. 
you,to help with the calculation. To simplify the problem. you are only asked to tell them 
how many ways there are to destroy the safety system. 

Input 

There are multiple test cases in the input file. Each test case start with two integers 
N (3<N<1000) and M (0M 10000) , followed by M lines describing the connections 
between the N computers. Each line contains two integers A. B (1A. Bc ND. which 
indicates that computer A and B are connected by a bidirectional cable. 

There is a blank line between two successive test cases. A single line with N=0 and 
M=0 indicates the end of input file. 

Output 

For each test case. output one integer number representing the ways to destroy the 


safety system in the format as indicated in the sample output. 


Sample Input Output for the Sample Input 


44 Case 1: 2 
12 Case 2: 11 
23 
34 
41 


79 
12 
13 
23 
34 
35 
45 
56 
57 
67 


00 
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l. 问题 描述 与 分 析 


美国 大 萧条 时 代 的 象征 ,人 称 逃 亡 路 上 的 罗密欧 与 朱丽叶 的 银行 大 盗 Bonnie 和 Clyde 
在 因特网 蓬勃 发 展 的 今天 又 得 到 了 新 生 。 他 们 一 改 冷血 杀手 的 旧 面 貌 , 干 起 了 网 上 银行 的 
盗 穷 行当 。 他 们 打算 破坏 网 上 银行 的 安全 系统 。 网 上 银行 的 安全 系统 由 若干 台 双 向 连接 的 


该 安全 系统 就 抽象 成 一 个 无 向 图 (因为 每 一 条 边 都 是 双向 的 )。 问 题 要 求 对 每 一 个 给 定 的 无 
向 连通 图 (安全 系统 ) ,计算 有 和 多少 种 方法 从 中 删除 两 个 顶点 ,而 使 得 图 不 再 连通 (其 余 各 项 
点 中 至 少 有 两 个 互 不 可 达 )。 这 和 计算 无 向 连通 图 的 关节 点 相似 ,不 过 计算 的 是 删除 两 个 项 
点 导致 不 连通 的 情形 。 问 题 形式 化 为 如 下 。 

输入 : 无 向 连通 图 G。 

输出 : 从 G 中 删除 两 个 顶点 ,使 得 G 不 连通 的 方法 数 。 

HE G 中 存在 关节 点 , 则 关节 点 与 图 中 任 一 其 他 项 点 均 可 构成 破坏 系统 的 点 对 。 当 


G 中 无 关节 点 时 ,可 以 通过 检测 所 有 | > =N= 2 对 顶点 被 删除 后 的 NCN— 0/2 个 
子 图 的 连通 性 来 解决 此 问题 。 
2. 算法 描述 


BONNIE-CLYDE(G) 

1n<|V[LGJ| 

2 A--ARTICULATIONCG,s) Ds EG 中 任 一 顶点 
3 m--lengthLA] 

4 ruays< 0 

5 if mA~0 

6 then for i<-1 to m 

7 do wa ys*-ways-- (1— i) 

8 return ways 

9 for each u,vE VLG] 

10 do G--DELETE-VERTEX(G .u) 

11 G'--DELETE- VERTEX (G'v—1) 

12 if DFS(G') 后 得 到 多 于 1 棵 树 的 森林 
13 then ways<-ways+1 

14 return ways 


算法 10-12 解决 Bonnie and Clyde 问题 的 过 程 


其 中 的 DELETE-VERTEX(G,w) 过 程 ,是 在 G 中 删除 顶点 u 返回 所 得 子 图 。 可 用 伪 代 
码 描述 如 下 。 

DELETE-VERTEX (G,u) 

1a--|VEGII 

2 for v1 to u—1 

3  doAdj'[v]—AdjUv] 
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4 for v--u--1 ton 

5 de Adj(v—1]--Adjv] 
6 for væl to n—1 

7 do for each w€ Adj'[v] 
8 do if w>u 


9 then w<-w—1 

10 else if w=u 

11 then 从 Adj’ [v] FBR w 
12 return G' 


算法 10-13 在 图 中 删 掉 一 个 顶点 的 过 程 


过 程 运行 时 ,第 2 行 和 第 3 行 . 第 4 行 和 第 5 行 两 个 for 循环 完成 在 顶点 邻接 表 数 组 中 
删除 顶点 的 邻接 表 。 第 6 一 11 行 的 for 循环 对 剩 下 的 每 一 个 顶点 的 邻接 表 扫 描 , 对 表 中 
的 结 点 做 如 下 操作 : 编号 等 于 的 ,直接 删除 ;编号 小 于 的 ,保留 不 变 ;编号 大 于 的 , 编 
号 减 1。 


3. 程序 实现 


1) 在 图 中 删除 一 个 项 点 
在 编写 解决 该 问题 的 程序 之 前 , 先 来 实现 在 图 中 删除 一 个 顶点 的 算法 10-13。 


1 void deleteVertex(Graph * g,int u){ 
2 intv,n=g->n—1; 

3 LinkedList **adj— (LinkedList**)malloc(n * sizeof( LinkedList * )) ; 
4 memepy(adj,g->adj,u * sizeof( LinkedList * )); 

5 memepy(adj+u,g->adjt+ut+1,(n—u) * sizeof( LinkedList * )); 

6 for(v=0;v<n3vt++){ 

7 ListNode * p—adj[ v]-»nil-»next; 

8 whileCp! — adj v]-»niD ( 

9 ifCCCvertex * )p->key)->index= =u) { 


10 ListNode * q=p->next; 

11 listDeleteCadj[ v]. p); 

12 clrListNode( p. NULL) ; 

13 free(p);p=q; 

14 continue; 

15 } 

16 if(( (vertex * ) p->key) ->index>u) 
17 CCvertex * ) p->key) -»index— — ; 
18 p=p->next; 

19 } 

20 } 

21 free(g->adj);g->adj=adj; 

22 g->n=n; 

23] 


程序 10-10 在 图 中 删除 一 个 顶点 的 C 函数 
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与 算法 稍 有 不 同 ,函数 中 删除 顶点 u 的 操作 是 针对 参数 g 进行 的 ,所 以 不 必 返 回 任何 数 
据 。 第 4 行 和 第 5 行 调用 库 函 数 memcpy 将 g 的 adj[0..u 一 1] 及 adg[u-- 1..n—1] E EE 
制 给 目标 数组 ,实现 算法 过 程 中 的 第 2 行 和 第 3 行 及 第 4 行 和 第 5 行 的 两 个 for 循环 。 第 
6 一 19 行 的 for 循环 完成 算法 过 程 中 第 6 一 11 行 的 操作 。 第 21 行 和 第 22 行将 删除 顶点 u 
后 的 数据 更 新 g。 

为 便于 代码 重用 ,将 程序 10-10 添加 到 文件 夹 graph 中 的 头 文件 graph. h 和 源 文件 
graph.c 中 。 

2) 实现 程序 


1 int numOfTree(Graph * g){ 


2 pair r, * df; 

3 int * pi,i,nt-0, * d, * f; 

4 r=dfs(g); 

5 pi 一 (intx )r. first; 

6  d-—(int * ) (CCpair * )r. second) —>first) ; 
7 {=Cint * )(((pair * )r. second) second) ; 
8 for(i=0;i<g->n;i 二 十 ) 

9 if(pi[i]==—1) 

10 nt 二 十; 


11 free(pi) ;free(d);free(f) ;free(r. second); 

12 return nt; 

13} 

14 int mainO( 

15 int n. m.count—0; 

16 FILE * fl, *f2; 

17 assert(f1— fopen("chap10/Bonnie and Clyde/inputdata. txt" ,"r")); 
18 assert(2— fopen("chap10/Bonnie and Clyde/outputdata. txt"."w")) ; 
19 fscanf(f1,"%d%d", &n,&-m); 

20 while(n || m) { / * 处 理 每 一 个 案例 * / 
21 Graph * g=zeroGraph(n) ; 

22 LinkedList * atps; 

23 int i, ways=0,number; 

24 for(i=0;i<msit++){ 


25 int u,v; 

26 fscanf(f1,"% d% d" , &-u, &-v); 
27 addEdge(g,u 一 1,v 一 1,1.0); 
28 addEdge(g.v—1,u— 1.1.0); 
29 } 


30 atps=articPoint(g,0); 

31 number=atps—>n;clrList(atps, NULL) ;free(atps) ; 
32 if(number) 

33 for(i=1;i< —=number;i+ +) 

34 wayst =(n—i); 
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35 elset 

36 int u,v; 

37 for(u=0;u<n;ut +) 

38 for(v=u+1;v<n;v++){ 
39 int k, * pi; 

40 Graph * gl—cloneGraph(g) ; 
41 deleteVertex(gl,u); 

42 deleteVertex(gl,v—1); 
43 if(numOfTree(gD) >1) 
44 wayst +; 

45 graphClear(gl) ; free(g1) ; 
46 ) 

47 } 


48 fprintf(f2,"Case %d: %d\n" , ++count, ways) ; 
49 graphClear(g) ;free(g) ; 

50 fscanf(f1,"%d%d",&n,&m); 

51 } 

52 fclose(f1) ; fclose({2) ; 

53 return 0; 

54 } 


TREE 10-11 解决 Bonnie and Clyde 问题 的 C 程序 


对 程序 10-11 的 说 明 如 下 。 

(1) 第 20 一 51 行 的 while 循环 处 理 输 入 文件 中 的 每 一 个 案例 。 其 中 ,第 21 行 创建 
了 一 个 具有 n 个 顶点 的 零 图 g, 第 23 行 声明 了 一 个 存储 计算 结果 的 变量 ways, 并 初始 
化 为 0。 

(2) 第 24 一 29 行 的 for 循环 在 输入 文件 中 逐一 读 取 顶 点 对 u、v, 并 将 边 (u,v) 和 (v,u) 
插入 图 g( 这 是 因为 g 是 无 向 图 ) 。 

G) 第 30—51 行 代码 实现 算法 10-13。 第 30 行 调用 程序 10-9 定义 的 函数 articPoint， 
计算 图 g 的 关节 点 。 第 31 行 解析 出 关节 点 的 个 数 number。 第 32 一 34 行 对 具有 关节 点 的 
情形 加 以 处 理 , 而 35 一 46 行 处 理 g 中 无 关节 点 的 情形 。 其 中 ,第 37 一 46 行 的 两 重 for 循环 
实现 算法 10-13 中 第 6 一 11 行 的 操作 ,对 在 图 g 中 删除 一 对 顶点 得 到 的 n(n 一 1)/2 个 图 gl 
逐一 检验 是 否 具有 连通 性 。 累 计 不 具有 连通 性 的 情形 数 即 为 所 求 。 其 中 ,第 43 行 调用 的 
函数 numOfTree 计算 g1 的 连通 分 支 数 ,该 函数 定义 于 第 1 一 13 行 。 函 数 中 调用 dfs 对 
gl 进行 深度 优先 搜索 ,对 返回 的 的 数组 pi 计算 其 中 值 为 一 1 的 元 素 个 数 , 即 深度 优先 森 
林 中 所 含 树 的 棵 树 ,由 于 gl 是 无 向 图 ,所 以 深度 优先 森林 中 树 的 棵 树 就 是 连通 分 支 
个 数 。 

程序 10-11 存储 在 文件 夹 chap10/Bonnie and Clyde 中 的 源 文 件 Bonnie andClyde. c 
中 ,读者 可 打开 文件 研读 ,并 试 运行 。 
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10.4 广度 优先 搜索 


10.4.1 算法 描述 与 分 析 


1. 问题 的 理解 与 描述 


广度 优先 搜索 (Broad First Search,BFS) 是 图 搜索 的 一 种 最 简单 的 算法 ,并 且 也 是 很 多 
重要 图 算法 的 原型 。 给 定 一 个 图 (有 向 或 无 向 )G 二 二 V ,E> 和 其 中 的 一 个 源 顶 点 *, 广 度 优 
先 搜索 系统 地 探索 G 的 边 以 “发 现 ” 从 s 出 发 每 一 个 可 达 的 顶点 : 发 现 从 s 出 发 距离 为 k 十 1 
的 顶点 之 前 先 发 现 距离 为 k 的 顶点 。 搜 索 所 经 路 径 中 的 顶点 , 按 先后 顺序 构成 “父子 关系 ”: 
先 发 现 的 顶点 us JE u 出 发 发 现 与 其 相 邻 的 顶点 v, 则 称 u Hou 的 父亲 。 由 于 每 个 顶点 只 
有 最 多 一 个 顶点 作为 它 的 父亲 ,所 以 搜索 路 径 必 构成 一 棵 根 树 ( 树 根 为 起 始 顶 点 0G, ,把 这 
棵 树 称 为 G 的 广度 优先 树 。 与 此 同时 ,还 计算 出 了 从 s 到 这 些 可 达 顶 点 的 距离 (最 少 的 边 数 
即 “ 最 短路 径 ")。 这 样 ,图 的 广度 搜索 问题 形式 化 描述 如 下 。 

MA: 图 G=<V.E>. WD sEV. 

输出 : G 的 广度 优先 树 G 以 及 树 中 从 树 根 s( 源 顶点 ) 到 各 结 点 的 距离 。 


2. 算法 的 伪 代 码 描述 


为 跟踪 整个 过 程 ,广度 优先 搜索 为 每 个 顶点 着 白色 .灰色 或 黑色 。 开 始 时 ,所 有 的 顶点 
都 着 白色 ,然后 可 能 变 成 灰色 ,再 后 来 可 能 变 为 黑色 。 一 个 顶点 在 搜索 过 程 中 首次 被 遇 到 称 
为 被 发 现 , 此 后 它 就 不 再 是 白色 的 了 。 所 以 ,灰色 的 或 黑色 的 顶点 是 已 经 发 现 的 ,广度 优先 
搜索 用 两 者 间 的 区 别 来 保证 搜索 进程 以 广度 优先 的 方式 进行 。 若 (u,v)EE 且 顶 点 4 是 黑 
色 的 , 则 顶点 v 不 是 灰色 就 是 黑色 的 , 即 与 黑色 顶点 相 邻 的 顶点 必 是 已 访问 过 的 。 灰 色 顶 点 
可 能 有 白色 相 邻 的 顶点 ;它们 表示 已 访问 过 的 与 未 访问 过 的 顶点 之 间 的 界线 。 

过 程 BFS 假定 输入 的 图 G 是 用 邻接 表 表 示 的 。 每 个 顶点 u € V. 的 颜色 存储 在 color Lu] 
中 。 为 计算 图 G 的 广度 优先 树 G。 RUN s 到 各 可 达 顶 点 的 距离 ,用 x[aj 表 示 顶 点 4 在 G: 中 
的 父 结 点 ,用 dLu ER A, s 到 的 距离 。 与 DFS 使 用 先进 后 出 的 栈 不 同 ,算法 使 用 一 个 先 
进 先 出 的 队列 Q 来 管理 灰色 项 点 集合 。 

BFS(G,s) 

1 for 每 个 顶点 we VIG]—{s} 

2 do color[ u]- WHITE 

3 d[u]«-9^ 

4 z[u]--NIL 

5 color s]-- GRAY 

6 d[Lsj<0 

7 QO 
8 ENQUEUE(Q. s) 
9 while Q7 
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10 do u*-DEQUEUE(Q) 


11 for each v € Adj[u] 

12 do if color[ v] - WHITE 

13 then color[v]-- GRAY 
14 z[v]-—u 

15 d[v]--au]--1 
16 ENQUEUE(Q,v) 
17 colorLu]--BLACK 


18 return x and d 
算法 10-14 图 的 广度 优先 搜索 算法 


第 1 一 7 行进 行 初始 化 工作 : 将 所 有 顶点 u 的 颜色 属性 color[uj 置 为 WHITE( 未 被 访 
问 ) ,距离 属性 置 du ] Eg eo , 父 结 点 指针 alul EA NIL, 将 入 队 的 源 项 点 s 的 颜色 属性 
color[s] 置 为 GRAY( 开 始 访问 ) ,距离 属性 d[s] 置 为 0。 第 8 行将 s 加 入 队列 Q。 

第 9 一 15 行 的 while 循环 重复 执行 直至 队列 Q 空 为 止 。 每 次 重复 将 队 首 元 素 u( 某 灰色 
顶点 ) 出 队 ,将 图 G 中 所 有 与 a 邻接 的 白色 顶点 v 着 成 灰色 (开始 访问 ) ,将 wv 的 父 结 点 指针 
指向 ,并 将 wv 的 距离 属性 d[vj 置 为 d[uj 十 1, 即 从 s 到 w 的 距离 置 为 ; 到 其 父 结 点 4 的 距 
离 加 1, 然后 人 队 。 最 后 将 u 着 成 黑色 (完成 访问 ) 。 

第 9 一 15 行 的 while 循环 只 要 还 有 灰色 顶点 就 会 重复 ,这 些 灰 色 顶 点 是 已 被 发 现 但 尚 
未 扫描 其 邻接 表 的 项 点。 为 证 明 此 算法 的 正确 性 ,需要 说 明 算法 运行 结束 时 所 有 从 s 可 达 
的 顶点 wv 都 被 搜索 到 , 且 xo itat FA s 到 vw 的 一 条 最 短路 径 上 w 的 父 结 点 ,d[vj 是 这 条 
最 短路 径 的 长 度 。 

图 10-11 示例 了 BFS 作用 在 一 个 简单 的 图 上 的 过 程 。 由 BFS 产生 的 树 中 的 边 表示 为 
带 有 阴影 。 每 个 顶点 u 内 部 显示 的 是 d[uj。 队 列 Q 显示 的 是 第 8 一 15 行 的 while 循环 每 
次 重复 前 的 状态 。 队 列 中 顶点 距离 显示 在 顶点 下 方 。 


3. 算法 的 正确 性 


引 理 10-3 从 源 顶 点 到 任何 顶点 vw 的 距离 必 不 超过 运行 BFS 后 过 此 顶点 的 
d 属性 。 

DEAN Av Ms 不 可 达 , 则 其 d 属性 将 维持 初始 值 ==。 若 ww 从 * 可 达 , 则 在 BFS 过 
BPH a 属性 得 到 改写 时 必 有 经 过 一 条 从 s 出 发 的 路 径 , 其 长 度 恰 为 4d[v]。 按 照 距离 的 意 
义 , 它 是 从 s 到 wv 的 最 短路 径 的 长 度 。 所 以 ,dLv] 作 为 一 条 从 s 到 vw 的 路 径 长 度 当然 不 会 小 
Ts 到 vw 的 距离 。 

引 理 10-4 BAFI Q— (oi ivo it vu) W o, ] d Loi J+ 1C HIA JE CE. d 的 属性 不 超 
过 队 首 元 素 d 的 属性 加 1) , 且 div ]- dv; ]) dv, ]. 

要 证 明 这 一 事实 ,可 以 对 算法 中 对 队列 Q 的 操作 次 数 k 做 数学 归纳 。k 二 1 时 , 即 对 
Q 的 第 1 次 操作 ,发 生 在 第 8 行 。 此 时 Q={s) ,结论 当然 为 真 。 

RE RIGS DH nie X BI Q= 0 vo od dlv, 12 dL 12-1. A din] 
d[v]«--d[w]. FAEK k=iG>DIN Siete A. xu ki 次 操作 的 种 类 分 
别 讨论 。 首 先 ,假定 本 次 操作 是 第 10 行 的 出 队 操作 。 这 时 ,原来 的 队 首 元 素 v 被 弹出 队 
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图 10-11 BFS 对 一 个 无 向 图 的 操作 


列 ,而 原来 的 元 素 vs 成 为 队 首 。 这 时 根据 归纳 假设 ,d[v,] 夺 d[v] 十 1 二 d[vj 十 1, 即 队 尾 
元 素 的 d 属性 不 超过 队 首 元 素 的 d 属性 加 1。 而 不 等 式 avs ]-— v, ]HE DE IIT 

其 次 ,假定 第 次 操作 是 发 生 在 第 16 行 的 入 队 操作 。 这 里 又 需要 分 两 种 情况 : 其 一 ， 
上 次 操作 是 出 队 操作 ,出 队 的 顶点 为 wx。 根 据 归 纳 假设 得 出 zx HBA E d Lu] [o JX 
dlo ]& Lv, ]d[vi J+1=dlul+1. u 出 队 后 ,vs 成 为 队 首 。 本 次 人 队 的 顶点 在 第 
15 行 获得 新 的 属性 d[ 四 =d[aq 二 1 过 gd[o] 十 1, 即 ww 入 队 后 ,作为 队 尾 元 素 的 d 属性 不 
超过 队 首 元 素 的 4 AEM. HEP dos] —[v, ]Ed [oi ] 2-1 — d[u] 4-1 — d [v]. Bl A 


入 队 的 顶点 都 与 顶点 u 相 邻 ,所 以 ,它们 的 d 属性 相等 都 等 于 d [aq 十 1。 至 此 ,本 引 理 得 证 。 
由 引 理 10-4 知 ,在 BFS 过 程 中 ,顶点 按 入 队 的 前 后 顺序 ,其 4 属性 不 减 , 即 先 入 队 的 顶 


利用 引 理 10-3 和 引 理 10-4, 可 以 说 明 引 理 10-5。 

引 理 10-5 运行 BFS 后 ,图 G 中 各 顶点 v 的 d 属性 记录 了 s 到 vw 的 距离 。 

对 slo 的 距离 & 做 数学 归纳 。k 二 1 时 , 即 考虑 所 有 与 s 相 邻 的 顶点 v ,它们 在 BFS 的 
第 9 一 18 行 的 while 循环 的 第 1 次 重复 中 均 被 染 成 灰色 且 将 d 属性 置 为 1 后 入 队 ,由 于 在 
BFS 中 ,每 个 顶点 至 多 进入 队列 Q 一 次 ,所 以 这 些 顶 点 的 d 属性 此 后 不 会 被 改变 , 即 过程 结 
束 时 ,其 4d 属性 记录 了 从 s 到 vw 的 距离 。 
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假定 对 所 有 从 s 出 发 距离 为 & 一 ;二 1) 的 顶点 v.is 17 BFS 后 ,d 属性 记录 了 距离 , 即 
d[vj 二 i。 下 面 证 明 对 于 所 有 从 s 出 发 距离 为 k==i 十 1 的 顶点 ,在 BFS 中 将 得 到 值 为 i 十 1 的 
d 属性 值 。 设 v 是 任 一 从 s 出 发 距离 为 i 十 1 的 顶点 ,并 设 p: s uv Hs 到 wv 的 一 条 最 短 
路 径 , 即 |p|==i 十 1。 设 p 中 从 :到 顶点 的 部 分 为 py, 则 pi 为 ;到 4 的 一 条 最 短路 径 ( 这 是 因 
ABE MWA s 到 的 一 条 更 短路 径 ,pi : 5 uW pl 连接 (u,v) 将 得 到 一 条 从 :到 wv 的 比 p 更 
短 的 路 径 , 这 与 p ERAKETA). W.| p | 二 i, 根 据 归纳 假设 ,d[uj] 二 i。 我 们 断言 ,uw 出 
队 时 ,wv 是 白色 的 。 否则 ,wv EE u 更 先 人 队 ,根据 引 理 10-3 知 ,d[v] 写 i 十 1; 而 根据 引 理 10-4 知 ， 
d[uj 宇 dL[v] 之 i 十 1。 这 与 dlul=i FR. 这样, 出 队 时 ,第 11 一 17 行 的 for 循环 必 能 在 
第 13 行 检测 出 vv 是 与 相 邻 且 为 白色 的 ,并 在 第 15 行 得 到 它 的 d 属性 值 为 d[w] 十 1=i 十 1。 

最 后 ,观察 算法 可 知 ,对 所 有 从 s 可 达 的 顶点 v,d[v] 的 值 是 在 第 14 行 确定 了 x[v] 为 顶 
点 后 ,第 15 行将 其 确定 为 其 父 结 点 的 d[w]j 值 加 1。 根 据 上 述 d 属性 的 说 明 可 知 记录 在 
clo} PAY u 确实 就 是 * Blu 的 一 条 最 短路 径 上 w 的 父 结 点 。 


4. 算法 的 运行 时 间 


第 1 一 4 行 的 循环 重复 |V| 次 。 另 一 方面 ,由 于 每 条 边 在 搜索 过 程 中 有 且 仅 有 一 次 被 访 
问 , 第 9 一 17 行 两 重 循环 谤 套 内 的 操作 被 执行 EI 次。 所 以 BRS 的 总 运行 时 间 是 OCV + 
E)。 于 是 ,广度 优先 搜索 运行 于 G 的 邻接 表示 规模 的 线性 时 间 内 。 


10.4.2 程序 实现 


由 于 在 图 的 广度 优先 搜索 算法 10-14 中 要 借助 一 个 队列 来 管理 各 顶点 的 搜索 顺序 ,所 以 
我 们 还 需要 实现 队列 的 数据 结构 。 这 在 第 2 章 中 的 程序 2-15 和 程序 2-16 中 已 经 定义 了 。 


1 pair bfs(Graph * g,int s){ 

2 Queue * Q=createQueue(sizeof(int) ) ; 

3 int * pi, * dii; u.v.n—g-»n: 

4 Color * color; 

5 pi= (int * ) malloc(n * sizeof Cin) ; 

6 d= Cint * )malloc(n * sizeofCint) ) ; 

7 color= (Color * )malloc(n * sizeof(Color) ) ; 
8 for(i=0;i<g->n;it+ +) { 


9 pili]J=—1; 

10 d[i]—-INT MAX; 
11 color[i]= WHITE; 
12 } 

13 d[s]=0; 


14 color[s]- GRAY; 

15 enQueue(Q, &-s); 

16 while(!queueEmpty(Q)) { 

17 ListNode * q=deQueue(Q); 
18 u= * (int * )q->key; 

19 clrListNode(q, NULL) ; 

20 q— g-»adj[ u]-»nil-»next; 
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21 while(q! — g-»adj[ u]-»niD ( 
22 v=((vertex * )(q->key))->index; 
23 ifCcolor[ v] — — WHITE) { 
24 color[ v] - GRAY; 

25 d[v]-d[u]-1; 

26 pilv]=u; 

27 enQueue(Q, &-v); 

28 } 

29 q=q->next; 

30 } 

31 color[u]— BLACK ; 

32 ) 


33  clrQueue(Q, NULL); 
34 free(Q); 
35 return make pair(pi, d) ; 


程序 10-12 实现 图 的 广度 优先 搜索 算法 10-14 的 C 源 代码 


对 程序 10-12 的 说 明 如 下 。 

(1) bfs 的 两 个 参数 分 别 是 图 的 邻接 表 表 示 g 和 源 顶 点 s。 由 于 BFS 要 返回 两 个 数组 ， 
所 以 在 C 中 需要 将 它们 封装 成 一 个 对 象 。 利 用 在 第 8 章 的 8. 3. 4 节 中 开发 的 结构 体 pair 来 
作为 封装 两 个 数组 的 工具 。 

(2) 第 2 行 声明 了 一 个 队列 Q。 第 3 行 声明 的 整 型 指针 d 和 pi 对 应 于 算法 中 的 数组 
d 和 x,u 和 v 对 应 于 算法 中 同名 的 临时 表示 顶点 的 变量 。 第 4 行 声明 了 一 个 与 算法 中 同名 
的 顶点 颜色 数组 color。 第 8 一 15 行 实现 算法 中 第 1 一 8 行 的 初始 化 工作 。 

(3) 第 16 一 32 行 实现 的 是 算法 第 9 一 17 行 的 while 循环 。 由 于 在 C 中 为 了 让 队列 这 一 
数据 结构 具有 通用 性 ,使 用 了 void * 指针 ,所 以 程序 中 为 了 使 用 这 样 的 数据 结构 就 要 借助 指 
针 来 完成 对 数据 的 读 写 。 读 者 需要 对 代码 中 的 这 些 指针 操作 给 予 充 分 的 注意 。 第 35 行将 
数组 pi Fl d 封装 于 pair 对 象 中 并 将 其 返回 。 

为 便于 代码 重用 ,将 程序 10-12 存储 在 文件 夹 graph 中 的 头 文件 bfs. h( 函 数 原型 声明 ) 
和 源 文件 bfs. ce( 函 数 定义 代码 ) 中 。 


10.4.3 ”应 用 一 一 攻 城 掠 地 


Risk 


Risk is a board game in which several opposing players attempt to conquer the world. 
The gameboard consists of a world map broken up into hypothetical countries. During a 
player's turn. armies stationed in one country are only allowed to attack only countries 
with which they share a common border. Upon conquest of that country.the armies may 
move into the newly conquered country. 


During the course of play.a player often engages in a sequence of conquests with the 
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goal of transferring a large mass of armies from some starting country to a destination 
country. Typically. one chooses the intervening countries so as to minimize the total 
number of countries that need to be conquered. Given a description of the gameboard with 
20 countries each with between 1 and 19 connections to other countries. your task is to 
write a function that takes a starting country and a destination country and computes the 
minimum number of countries that must be conquered to reach the destination. You do not 
need to output the sequence of countries. just the number of countries to be conquered 
including the destination. For example.if starting and destination countries are neighbors, 
then your program should return one. 


The following connection diagram illustrates the sample input. 


i c 19. / 
=> O0 
BOY 
15 16 
图 10-12 连接 图 


Input Format 

Input to your program will consist of a series of country configuration test sets. Each 
test set will consist of a board description on lines 1 through 19. The representation avoids 
listing every national boundary twice by only listing the fact that country I borders country 
J when I—J. Thus,the Ith line. where I is less than 20,contains an integer X indicating 
how many "higher-numbered" countries share borders with country I, then X distinct 
integers J greater than I and not exceeding 20. each describing a boundary between 
countries I and J. Line 20 of the test set contains a single integer (1--N«100) indicating 
the number of country pairs that follow. The next N lines each contain exactly two 
integers (I<A,B<20; AFB) indicating the starting and ending countries for a possible 
conquest. 

There can be multiple test sets in the input; your program should continue reading 
and processing until reaching the end of file. There will be at least one path between any 
two given countries in every country configuration. 

Required Output Format 

For each input set. your program should print the following message “Test Set # T" 
where T is the number of the test set starting with 1. The next NT lines each will contain 
the result for the corresponding test in the test set-that is. the minimum number of 
countries to conquer. The test result line should contain the start country code A. the 
string "to". the destination country code B.the string “:” and a single integer indicating 
the minimum number of moves required to traverse from country A to country B in the test set. 


Following all result lines of each input set. your program should print a single blank line. 
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Sample Input 


13 
234 
3456 
16 
RT 
21213 
18 
2910 
Li 
in 
21217 
114 
21415 
21516 
116 
119 
21819 
120 
120 
5 

120 
29 
195 
18 19 
16 20 


Sample Output 


Test Set #1 
1 to 20:7 
2to9: 5 
19 to 5: 6 
18 to 19; 2 
16 to 20: 2 


l. 问题 描述 与 分 析 


Risk 是 一 款 战略 游戏 。 模 拟 世界 的 沙盘 分 成 20 个 城市 ,每 个 城市 与 其 他 1 一 19 个 城 
市 相连 。 任 一 玩家 要 从 一 个 指定 的 起 始 城市 进军 到 另 一 个 指定 的 目标 城市 。 轮 到 已 方 玩 
时 ,玩家 需 从 当前 占领 的 城市 攻击 下 一 个 与 之 相连 的 城市 。 这 样 ,他 就 可 以 让 其 军团 占领 这 
个 城市 。 当 然 ,每 攻 下 一 个 城市 ,就 要 分 兵 占 领 。 所 以 ,希望 计算 从 起 始 城市 到 目标 城市 之 
间 最 少 需要 攻占 的 城市 数 。 如 果 将 城市 视 为 顶点 ,相连 的 城市 表示 为 顶点 间 的 边 , 这 将 构成 
一 个 无 向 无 权 图 G。 本 问题 是 对 该 无 向 图 G 中 指定 的 源 顶 点 x 和 目标 顶点 v 之 间 计 算 最 短 
路 径 ( 路 径 所 含 边 数 最 少 ) 所 含 顶 点 数 (包括 目标 顶点 v, 但 不 包括 源 顶点 zx) 的 问题 。 这 恰好 
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是 uv 之 间 最 短路 径 的 长 度 。 所 以 ,可 以 利用 BFS, 对 给 定 的 无 向 图 G 中 顶点 u、v, 调 用 


BFS(G,w) ,利用 返回 的 数组 a 计算 所 要 求 的 数值 4[v]。 
2. 程序 实现 
利用 BFS 的 实现 函数 ,很 容易 解决 Risk 问题 。 


1 int mainO( 
2 FILE * fl, * f2; 

3 assert(f1— fopen("chapl10/Risk/inputdata, txt" ,"r")) ; 

4 assert({2=fopen("chap10/Risk/outputdata, txt" ,"w")); 
5 while(! feof(f1)){ 

6 int i,j,k,x, *d,n,A,B,c=0; 

7 Graph * g=zeroGraph(20) ; 

8 

9 


pair ps 
for(i=0;i<19;i++){ 
10 fscanf(f1,"%d" ,&-x); 
11 for(k=0;k<x;k++){ 
12 fscanfCf1, " d", &-j); 
13 j= 
14 addEdge(g,i,j,1.0); 
15 addEdge(g,j,i,1.0); 
16 ) 
17 ) 


18 ÍprintfCf2, " Test Set 井 %dNn" ,十 十 c); 
19 fscanf(f1,"%d",&-n); 
20 for(i=0si<nsit++){ 


21 fscanf(f1,"%d%d",&A,&-B); 

22 p=bfs(g,A—1); 

23 Íree( p. first) ;d= (int * ) p. second; 

24 fprintfCf2," 4d to 26d: %d\n",A,B,d[B—1]); 
25 free(d) ; 

26 } 

27 graphClear(g) ;free(g) ; 

28 } 


29  fclose(f1) ; fclose({2) ; 
30 return 0; 
31) 


程序 10-13 ”解决 Risk 问题 的 C 程序 
对 程序 10-13 的 说 明 如 下 。 


COD 第 5 一 28 行 的 while 循环 处 理 输 入 文件 中 的 每 一 个 案例 。 其 中 ,第 7 行 创建 了 一 个 
具有 20 个 顶点 的 零 图 g。 第 9 一 17 THRE for 循环 将 案例 数据 中 每 一 个 城市 与 其 他 城市 


的 相 邻 信息 ,作为 图 中 的 边 插入 ge 


(2) 第 20 一 26 行 的 for 循环 对 案例 中 每 一 对 起 止 点 A、B, 通 过 第 22 行 调用 函数 
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bfs, 计 算出 从 A 出 发 到 达 其 他 城市 的 最 短 距离 ,第 24 行将 A 到 B 的 最 短 距离 写 信 输 
大 文件 。 
程序 10-14 存储 为 文件 夹 chap10/Risk 中 的 源 文件 risk. c, 读 者 可 打开 文件 研读 ,并 试 


运行 。 
10.5 流 网 络 与 最 大 流 问 题 


10.5.1 算法 描述 与 分 析 


1. 问题 理解 与 描述 


1) 流 网 络 

个 流 网 络 G=<V ,E 二 是 一 个 有 向 图 ,其 中 的 每 一 条 边 (u,v) EE 有 一 个 非 负 的 实数 
容量 c (u,v) 宇 0。 若 (u,v) EE, 假 定 c(u,v)==0, 即 : 
非 负 实数 usv € V. HG € E 
0 uv € V, H (u.v) Ẹ¢ E 
在 网 络 中 标识 两 个 顶点 : 一 个 称 为 源 点 , 记 为 ;一 个 称 为 汇 点 , 记 为 :。 假 定 每 一 个 顶点 都 
位 于 从 源 点 到 汇 点 之 间 的 某 条 路 径 上 , 即 对 每 一 个 顶点 vEV, 有 一 条 路 径 y v to MA, 
该 图 是 连通 的 ,上 且 | 天 | 之 |V | 一 1。 网 络 的 一 个 例子 ,如 图 10-13 所 示 。 


cCusv) = | 


10-13 ”网 络 图 


图 10-13(a) 为 网 络 G==(V,E)。 源 点 为 ;, 汇 点 为 :。 每 条 边 都 标注 其 容量 。 图 10-13(b) 
中 ,G 中 的 一 个 流 f 其 值 | /=19。 图 中 只 显示 正 的 流 , 若 f (u,v) 记 0, 边 (u,v) 标 示 为 
flusv)/clu,v)( 斜 杠 仅 用 来 分 隔 流 与 容量 ,并 不 表示 除法 )。 若 f(u,v) 三 0, 边 (u,v) 仅 标示 
为 其 容量 。 

2) ift 

iB G=<V,E>R—-+*+M4 RARE c. Ks 为 该 网 络 的 源 点 ,: 是 汇 点 。G 中 的 
一 个 流 是 一 个 实数 值 函 数 和: VXV 一 R, 它 满足 如 下 三 条 性 质 。 

BEAR: 对 所 有 的 u,vEV ,要 求 f Cu) cu). 

斜 对 称 性 : 对 所 有 的 u,vEV ,要求 f (u,v)= 一 f (wou). 

流 守 恒 性 ; 对 所 有 的 w € V — (s) BRD fav) = 0. 

wEV 


量 了 (u,v) 可 以 是 正 的 、 零 或 负 的 , 称 为 是 从 顶点 到 顶点 v 的 流 。 一 个 流 S EEA 
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Ifl 3G» (10-3) 
veV 
也 就 是 说 ,流出 源 点 的 总 的 流 ( 此 处 ,记号 |， | 表示 流 的 值 , 并 非 绝 对 值 或 势 ) 。 

对 于 任何 流 网 络 G, 必 存在 流 f。 例 如 ,对 所 有 的 (u,v)EVXV, 令 fuv) —0,3X — K 
数 满足 流 的 所 有 3 个 性 质 ,所 以 它 是 G 的 一 个 流 。 把 这 一 特殊 的 流 记 为 f。。 显 然 ， 
| fol=0. 

3) 最 大 流 问题 

在 最 大 流 问 题 中 ,已 知 一 个 网 络 G 及 其 源 点 s 和 汇 点 上 ,希望 找到 具有 最 大 值 的 流 。 形 
式 化 为 如 下 。 

输入 : 网 络 G=<V.E> ,其 中 源 点 为 s, 汇 点 为 上 ,定义 在 VXV 上 的 容量 c。 

输出 : 定义 在 VXV 上 的 流 f: VXV>R, 使 得 | /| = SOP Cs.) 最 大 。 


veV 

4) 剩余 网 络 

在 解决 最 大 流 问 题 的 方法 中 ,有 一 个 很 重要 的 概念 一 一 剩余 网 络 。 直 观 地 看 ,对 给 定 的 
网 络 及 一 个 流 ,其 剩余 网 络 由 可 以 接受 更 多 流 的 边 组 成 。 更 形式 化 地 说 ,假定 有 一 个 网 络 
G=<V,E> ,其 源 点 为 *, 汇 点 为 5。 设 了 为 G 中 的 一 个 流 ,考虑 一 对 顶点 u,v€EV。 不 超过 
容量 c(x,o) A u lo 可 以 添加 的 流量 是 (u,v) 的 剩余 容量 .定义 如 下 : 

CU) = cGu sv) — f(u,v) (10-4) 

例如 , 若 cCu v) 16 H. f(ausv) 二 11, 则 可 以 在 对 边 (u,v) 的 容量 限制 下 对 ACs o 
c; Cu o) —5 个 单位 。 当 流 /(u,v) 为 负 时 ,剩余 容量 cj (u,v) 将 大 于 容量 cuv). Win, FF 
clusv) 二 16 且 /(u,v) 二 一 4, 则 剩余 容量 cy Cu 0023 20. 

给 定 一 个 流 网 络 G 王 二 V, 已 二 和 一 个 流 f.G 的 根据 了 的 剩余 网 络 记 为 Gyr = 
XV.E, dtp 

E, = {(u,v) € V XV :c, Cu) > 0] 

也 就 是 说 ,剩余 网 络 的 每 一 条 边 ,也 称 为 剩余 边 ,可 容纳 一 个 大 于 0 的 流 。 

5) 增 广 路 径 

要 用 到 的 另 一 个 重要 概念 是 流 网 络 中 的 增 广 路 径 。 为 研究 增 广 路 径 及 其 性 质 , 先 讨论 
流 网 络 中 两 个 流 的 和 。 已 知 流 网 络 G—-—V.E-. t fii RI fo HAV XV 到 R 的 流 函数 。 
定义 VXV 到 R 的 函数 fi 十 f;: 

对 任意 的 u,v€V,(fi 二 fa2)(usv)=fi(usv) + fa Qu). 

E 户 十 户 满足 容量 约束 性 , 即 对 所 有 的 weve VA CfA + fe) usv) Scelus v), PEIA, 
十 fz 是 流 网 络 G 的 一 个 流 。 这 是 因为 fi + fa 除了 满足 容量 约束 性 外 ,对 所 有 的 u,v€EV, 有 
(Ath) (usv) = fi (uD) fa Cu 0) — — fi Cosa) + fa Cou) — — (fit fa). (vsu) M 万 十 


Sa 满足 流 的 斜 对 称 性 。 此 外 ,对 所 有 的 u€ V — Gti A+ few) = Ade. 


veV vEV 


v) + faluso) = X fiuo) + X fuv) = 0+0 = 0, EI fiH fa 满足 流 的 守恒 性 质 。 
v€V 


vev 


给 定 网 络 G= (V E) &— itt 太一 条 增 广 路 径 p 是 剩余 网 络 Gy 中 的 一 条 从 s 到 1 的 
简单 路 径 。 根 据 剩余 网 络 的 定义 , 增 广 路 径 上 的 每 一 条 边 (x,v) 将 接纳 一 些 从 zx 到 z 的 附加 
正 流 而 不 会 违背 该 边 上 的 容量 限制 。 

图 10-14(b) 中 带 有 阴影 的 路 径 就 是 一 条 增 广 路 径 。 将 图 中 的 剩余 网 络 G 视 为 一 个 网 
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络 ,可 以 对 此 路 径 上 的 每 一 条 边 增加 4 个 单位 的 流 而 不 违背 容量 限制 ,这 是 因为 此 路 径 上 的 
最 小 剩余 容量 为 cr(w ,vs) 二 4。 我 们 称 能 在 增 广 路 径 p 的 每 条 边 上 增加 的 最 大 流量 为 p 的 
剩余 容量 ,定义 如 下 : 
cjCGp) = minlcjGu) : Qu TE p E} 

设 G=(V,E) 为 一 网 络 ,f 为 G 中 的 一 个 流 ,p 为 Gj 中 的 一 条 增 广 路 径 。 定 义 函数 f, 

VXV 一 Z 为 
ci(p) Gu v) TE p E 
fp(usv) = 1 一 cr(Cb) (v.u) 在 p 上 (10-5) 
0 其 他 
则 可 以 验证 f 是 Gy 中 的 一 个 值 为 | f,1(|f,|==cj(p) 二 0) 的 流 。 首 先 ,对 于 p 上 的 每 一 条 
Cuv), H f, Qi =c Cp — minleg Gies) : (usv) 在 p 上 }) 知 ,对 p 上 的 每 一 条 边 (u,v)， 
有 fius) Sc, (u,v) ,而 对 Gy rpg Poft Bf Gus ,fp(us,v) 二 0 二 cy(usv), 即 f, 满足 流 
的 容量 约束 性 。 其 次 ,对 于 所 有 p 上 的 每 一 条 边 (u,v) ,根据 式 (10-4) 可 知 fp Qu v) = 
— f, Cu o) ,而 对 Gy HAND Sr Ef) Cu o sf, (usv) 二 0 二 一 f(v,w), 即 f 满足 流 的 斜 对 
称 性 。 最 后 ,对 所 有 的 u€ V— s) ,wvEV, 若 (usv) 在 p 上 , 则 可 能 有 3 种 情形 : 其 一 ,v= 
so EHE fp Guo) Sp (usu) Sp (seu) cslb): HZ, vás 且 wv 关 4, 此 时 ,f, (u,v) 和 
f, Cos i th BLE RA Dif uro) 中 ,根据 斜 对 称 性 相互 抵消 ;其 三 ,v=4, 此 时 f, Ceo) = 
flusl) 二 cjy(p), 它 与 第 一 种 情形 相 加 亦 相 互 抵消 。 对 (u,v) 和 (wv,u) 均 不 在 p 上 的 情形 
fp(usv) 二 0。 总 之 对 所 有 的 u€ V — (1) € V. S f Cuv) = 0, 此 即 说 明 f, 是 Gj 的 一 
veV 

个 流 , 而 | fy | =e Cp) FE SB EUG a i AB HE cp Cp) 。 

图 10-14(a) 为 图 10-13(b) 中 的 流 网 络 G 和 流 /。 图 10-14(b) 剩 余 网 络 Gj, 带 有 阴影 
的 是 增 广 路 径 p; 其 剩余 容量 为 cj(p) 二 cCvs,v3) 二 4 。 图 10-14(c) 为 沿路 径 p 增加 剩余 容 
量 4 所 得 的 G 中 的 流 。 图 10-14(d) 为 由 图 10-14(c) 中 的 流 引出 的 剩余 网 络 。 


图 10-14 剩余 网 络 与 增 广 路 径 


设 G==(V,E) 为 一 流 网 络 ,f AG 中 的 一 个 流 ,p 为 Gy 中 的 一 条 增 广 路 径 。 设 Sf, ER 
(10-5) 中 定义 。 定 义 函数 f”: VXV > R, 其 中 / =/ 十 f,。 则 /为 G 中 值 为 |7'|= 
1fl 十 1fs1 之 1 了 1 的 一 个 流 。 这 是 因为 根据 式 (10-4), 对 所 有 的 u,vE€EV, f, Cuv) S 
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cp (u,v) —cCu v) — f Cuv) , BELA 
f' (asv) =(f + fo) Qu) = fGusv) + fa Gus) 
<f(u,v) + GG v) — flu.v)) 
=c(u,v) 
这 说 明 f'— f+ f, 是 G hiii HEIL ll ffl lflcf,lilf,l-c; (2270. 
mL I> fl. 
此 性 质 说 明 ,可 以 利用 流 网 络 关于 流 f 的 剩余 网 络 中 的 增 广 路 径 使 流 网 络 G 的 流 增 
值 , 并 且 有 定理 10-1。 
定理 10-1 车 /是 G 的 一 个 最 大 流 , 则 G 关 于 了 的 剩余 网 络 G 中 不 存在 增 广 
路 径 。 
这 是 因为 , 若 Gr 中 还 有 一 条 增 广 路 径 p ,根据 式 (10-5) 定 义 的 f, 是 Gy 的 一 个 流 ,所 以 
WA f+ f, EG 中 一 个 其 值 严格 大 于 | 7 的 流 。 这 与 了 是 一 个 最 大 流 矛 盾 。 
6) 流 网 络 的 割 
流 网 络 G= V, OARS, MDE V 的 一 个 分 为 S 和 T=V 一 S, 且 ES 及 :ET 的 
一 个 划分 。 若 / 是 一 个 流 , 则 跨越 制 (S,T) 的 净 流 定义 
为 2) Df uw) 割 (S,T) 的 容量 为 23 P3TCRON 


u€S v€T wES v€T 
— ^r IU £f D BB I 9) 122 I 2 609 FE et] 09 6] 

图 10-15 展示 了 图 10-13 Cb) 中 的 流 网 络 的 制 
sst suz} Us m oO ,其 中 Sm {ssu vili T= {v 
vit), S 中 的 顶点 是 黑色 的 ,T 中 的 顶点 是 白色 的 。 图 10-15 。 流 网 络 的 害 
跨越 (S,T) 的 净 流 是 /CS,T)=19, 其 容量 为 c(S,T) 王 
26。 跨 越 该 制 的 净 流 为 

wyu) 十 Fum) 十 Fouw) 一 12 十 (一 4) 十 11 = 19 


且 其 容量 为 
clv sv) + cu») = 124-14 = 26 
设 /是 流 网 络 G 中 的 一 个 流 , 源 点 为 5, 汇 点 为 1, 设 (S,T) 为 G 的 一 个 制 。 则 跨越 
(S,T) 的 净 流 D few) =| 1。 这 是 因为 


u€ES veT 


DY NfGo =), X fuv) (根据 割 的 定义 ) 
MES veT weSve€V-S 
=> D fum fu (和 式 性 质 ) 
uES v€V uES ves 
= >) of Gv) (根据 流 的 斜 对 称 性 ) 
uES veV 
=D fGo d D Df uw) (和 式 性 质 ) 
veV u€S-sv€V 
= MfG) (根据 流 的 守恒 性 质 ) 
VEV 
-|fl ( 流 的 值 定义 ) 


512 10-6 HN G 中 的 任 一 个 流 f ,以 G 的 任 一 割 的 容量 为 上 界 。 
这 是 因为 根据 上 面 的 讨论 有 
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|f 17 Draw < 31 Deen (根据 流 的 定义 ) 


u€S v€T u€S v€T 


等 号 在 流 /的 值 | /| 最 大 且 制 (S,T) 的 容量 >， 》)c (u,v) 最 小 时 取得 。 


u€S vET 


利用 引 理 10-6, 下 面 来 证 明定 理 10-2。 
EE 10-2. 设 流 网 络 G 关 于 流 了 不 存在 增 广 路 径 , 则 /是 G 的 一 个 最 大 流 。 
由 于 Gr 中 没有 增 广 路 径 , 即 在 G, 中 没有 从 s 到: 的 路 径 。 定 义 
S—(v€V i Gy 中 存在 从 s Blu 的 路 径 } 
及 T=V 一 S$。 划分 (S,T) 是 一 个 割 : 显然 sSE5, 而 1#S, 这 是 因为 在 Gj 中 没有 从 s 到 1 的 
路 径 。 每 一 对 满足 ES 且 vET 的 顶点 ,有 flu,v) 二 clu,v), 这 是 因为 车 否 , uv) EE, 


这 意味 着 v 在 S 中 。 因此 | f 1— D Dao =) Detusv)。 根据 引 理 10-6 WA, f 
u€S v€T u€S v€T 
是 G 的 一 个 最 大 流 。 


2. 算法 的 伪 代 码 描 述 


定理 10-1 和 定理 10-2 实际 上 告诉 我 们 流 网 络 G 的 一 个 流 是 其 一 个 最 大 流 当 且 仪 
当 G AFS 的 剩余 网 络 Gyr 中 不 存在 增 广 路 径 。 这 就 引出 了 一 个 计算 流 网 络 最 大 流 的 算 
法 : 从 流 /开始 ,通过 一 系列 的 迭代 ,每 次 迭代 寻求 一 条 增 广 路 径 p, 并 对 p 上 的 每 条 边 的 
流 加 上 剩余 容量 cj(p) 得 到 新 的 更 大 的 流 ,计算 流 网 络 关于 了 的 剩余 网 络 Gj, 直 至 Gy 中 
不 存在 增 广 路 径 为 止 。 这 一 思想 用 伪 代 码 描述 如 下 。 


EDMONDS-KARP(G,s,tyc) 

Lfe fo 

2 crec 

3G,<G 

4 (n,d)<BFS(G,,s) 

5 while d[t]#co 

6 do px th REM s Be 的 路 径 
7 c,*-minle; Cus) : (u,v) fE p FP} 
8 for p 中 的 每 条 (u,v) 


9 do f[usv]*- fLusv]--c, 
10 flosude-- fluv] 

11 cer us v]*7cr Du v]— e, 
12 cr Evsu]*7c; Dv u]4- c, 


13 Grem c 决定 的 有 向 图 
14 Gd) *- BFSQ, 5) 
15 return f 


算法 10-15 解决 最 大 流 问 题 的 算法 EDMONDS-KARP 
第 1 行 初始 化 流 /为 /。。 第 2 行将 容量 矩阵 cr 初始 化 为 <。 第 3 行将 剩余 网 络 G 初 


始 化 为 G。 第 4 行 调用 广度 优先 搜索 算法 BFS, X} Gy 计算 以 * 为 源 顶 点 的 广度 优先 树 x 和 
5 到 图 中 各 顶点 的 最 短 距离 4。 第 5 一 14 行 的 while 循环 反复 寻求 Cr 中 的 一 条 增 广 路 径 
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p(BFS(Gy,s) 返 回 的 数组 d 记录 了 Gy PM s 到 各 顶点 的 最 短 距离 ,d[4] ACOH rd Gj 中 
存在 增 广 路 径 ) ,第 7 行 计算 剩余 容量 cv 。 通 过 第 8 一 12 行 的 for 循环 对 增 广 路 径 p 上 每 一 
边 计 算 剩余 流 。 第 13 行 根据 增 广 后 的 容量 矩阵 计算 剩余 网 络 Gr 。 第 14 行 调用 广度 优先 
搜索 算法 BFS, 对 Gj 计算 以 * 为 源 顶 点 的 广度 优先 树 x A s 到 图 中 各 顶点 的 最 短 距离 d o 
当 不 存在 增 广 路 径 时 ,f 就 是 一 个 最 大 流 。 第 15 行将 其 返回 。 图 10-16 展示 了 EDMONDS- 
KARP 在 一 个 样本 上 运行 的 每 一 次 迭代 的 结果 。 图 10-16(a) 一 图 10-16(d) 是 while 循环 的 
连续 的 选 代 。 每 一 部 分 的 左边 展示 的 是 第 4 行 确定 的 剩余 网 络 Gy, 带 阴影 的 是 其 增 广 路 径 
pp。 每 一 部 分 的 右边 展示 了 在 /上 加 上 f, 的 结果 。 图 10-16(a) 中 的 剩余 网 络 就 是 输入 
网 络 G。 图 10-16(e) 是 while 循环 最 后 检测 的 剩余 网 络 。 其 中 已 无 增 广 路 径 了 ,所 以 展 
示 在 图 10-16(d) 中 的 流 f 就 是 最 大 流 。 


图 10-16 基本 Ford-KARP 算法 的 执行 
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3. 算法 的 运行 时 间 


算法 EDMONDS-KARP 的 运行 时 间 取 决 于 第 5 一 14 行 的 while 循环 的 重复 次 数 。 为 估 
算 此 循环 的 重复 次 数 ,要 做 些 准备 工作 。 若 在 剩余 网 络 Gr 中 的 增 广 路 径 p 上 边 (u,v) 的 剩 
余 容量 为 p 的 剩余 容量 , 即 若 co Luv] c, ,我 们 说 (u,v) 在 增 广 路 径 上 是 临界 的 。 在 沿 
着 一 条 增 广 路 径 增加 流 之 后 ,该 路 径 上 的 任 一 临界 边 都 从 剩余 网 络 中 消失 。 此 外 ,在 任 一 条 
增 广 路 径 上 ,至 少 有 一 条 临界 边 。 下 面 来 说 明 |E| 条 边 中 的 每 一 条 至 多 能 成 为 IV1/2 一 1 次 
临界 边 。 为 此 ,首先 说 明 引 理 10-7。 

引 理 10-7 算法 EDMONDS-KARP 运行 于 源 点 为 ;、 汇 点 为 1 WHN G= (V E) ,对 任 
意 vEV 一 {5,4) ,其 在 剩余 网 络 中 的 最 短路 径 dj[vj 随 着 流 的 增 广 而 单调 增加 。 

如 果 不 是 ,假定 对 某 顶点 v€EV 一 {s,t) ,有 一 个 流 的 增 广 使 得 从 s 到 的 最 短路 径 减少 ， 
我 们 将 推出 一 个 矛盾 。 设 f£ 是 第 一 次 造成 某 条 最 短路 径 减 少 的 增 广 前 的 流 , 并 设 /7 恰 为 此 
增 广 后 的 流 。 设 v 为 具有 最 小 的 dy [四 的 顶点 ,其 距离 由 于 该 次 增 广 而 减少 ,所 以 dy [四 去 
d,[v].i& p=s uv 是 Gy 中 从 s 到 w 的 一 条 最 短路 径 , 所 以 Cu) € Ey H. 


dr[u] = dp[v]— 1 (10-6) 
根据 对 wv 的 选取 ,我们 知道 到 顶点 u 的 距离 并 不 减少 , 即 
dp[u] > dlu] (10-7) 


RIKE) EE; RAN EA uv) € E, WA 
d,[v] <d [u] +1 (根据 三 角形 不 等 式 ( 见 图 10-17)) 
入 dr [四 十 1 (根据 不 等 式 (10-7)) 
=dy[v] (根据 等 式 (10-6)) 
此 与 假设 dr [四 过 dr[ 四 矛盾 。 
图 10-17 tP, (usv) € EU s P) u IWER A dlu], 
到 v 的 距离 为 4Lvj,u 到 vw 的 最 短 距离 显然 为 1, 则 最 短 
Kis u.s v 和 uwu>v 之 间 必 有 称 为 三 角形 不 等 式 的 关 
系 dLv]xdLu]--1. 
现在 我 们 知道 (u,v) € E, HGi 0 € Ej 。 这 意味 着 
本 次 增 广 必 使 v 到 的 流 有 所 增加 。 由 于 EDMONDS- 
KARP 算法 总 是 沿 着 最 短路 径 增 广 流 ,所 以 Gy "PA s 到 
u 的 最 短路 径 必 以 (v,w) 作 为 最 后 一 段 边 。 于 是 
d,Lv] —d,[u]—1 
xdy[u]—1 (根据 式 (10-7)) 
一 dr [四 一 2 (根据 式 (10-6)) 
此 与 dr [四 <dr[ 四 的 假设 矛盾 。 这 样 推出 存在 这 样 的 顶点 "是 错误 的 。 
利用 引 理 10-6, 可 以 说 明 对 每 一 条 边 (u,v) EE, 至 多 能 成 为 IlV1/2 一 1 次 临界 边 。 事 实 
上 ,由 于 增 广 路 径 是 最 短路 径 , 当 (uv) 首次 为 临界 边 时 ,有 
d,Lv] 一 d,[u] +1 
一 旦 该 流 被 增 广 , 边 (u,v) 就 在 此 剩余 网 络 中 消失 。 直 至 从 到 的 流 被 减少 ,这 只 可 能 发 
生 在 (wz) 出 现在 一 条 增 广 路 上 。 车 /是 该 事件 发 生 时 G 中 的 流 , 有 


10-17 三 个 顶点 间 的 路 径 
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dp[u] = dp[v] 4-1 
根据 引 理 10-8, 有 dr[ 四 入 dr [v]. fi 
dr[u] =dp [v] +1 > d,[v]- 1 = d,[u] - 2 

所 以 ,从 (u,v) 变 为 临界 到 它 下 一 次 又 变 为 临界 为 止 ,从 源 s 到 的 距离 至 少 增加 了 2. 
JA s 到 的 距离 初始 时 至 少 为 0。 从 s Su 的 最 短路 径 上 的 中 间 顶 点 不 可 能 包含 ;、u 或 
1( 这 是 因为 (4,v) 位 于 一 增 广 界 路 径 上 意味 着 wu 了 1) 。 这 样 ,即使 直至 成 为 从 源 s 不 可 达 
时 ,其 距离 至 多 为 IlV| 一 2。 于 是 , (u,v) 至 多 有 (IV| 一 2)/2 二 IV1/2 一 1 次 可 能 成 为 临界 的 。 
由 此 可 见 ,EDMONDS-KARP 过 程 的 第 5 一 14 行 的 while 循环 的 重复 次 数 为 O(EV)。 

定理 10-3 # EDMONDS-KARP 算法 运行 于 源 为 * 汇 为 1 的 一 个 流 网 络 G 二 (V,E) 上 ， 
则 算法 的 运行 时 间 为 OV E). 

这 是 因为 第 5 一 14 行 的 while 循环 的 OCEV) 每 一 次 重复 执行 时 ,第 8 一 12 行 的 for 循环 
耗 时 OCV) ,第 14 行 调用 BFS 耗 时 OV 十 E)( 见 10. 4 节 对 算法 BFS 的 分 析 ), 由 于 所 有 顶 
点 从 都 是 可 达 的 ,所 以 |E| 三 |V| 一 1, 故 每 次 重复 耗 时 O(E)。 这 样 ,就 得 到 算法 的 运行 时 
间 为 O(VE?)。 

EDMONDS-KARP 算法 还 有 一 个 很 有 趣 的 性 质 : 若 流 网 络 G 中 的 容量 均 取 整数 值 , 则 
G 的 最 大 流 的 值 也 是 整数 ,这 个 特性 称 为 完备 性 。 完 备 性 的 正确 性 可 以 通过 对 如 下 事实 的 
观察 得 到 : EDMONDS-KARP 算法 是 从 fo 开始 ,反复 增 广 最 终 得 到 流 网 络 G 的 最 大 流 So 
每 次 增 广 得 到 的 剩余 网 络 中 的 容量 都 是 整数 值 的 增 减 ,增加 的 流量 也 是 整数 值 。 

一 些 组 合 问题 可 以 很 容易 地 表示 为 最 大 流 问题 。 下 面 介 绍 一 个 这 样 的 问题 : 在 一 个 二 
部 图 ?中 寻求 最 大 匹配 。 为 解决 此 问题 ,要 利用 
EDMONDS-KARP 算法 所 提供 的 完备 性 好 处 。 


4. 二 部 图 的 最 大 匹配 问题 


给 定 一 个 无 向 图 G=(V, E) ,一 个 匹配 是 边 的 
一 个 子 集 M C E 使 得 对 所 有 的 v€EV, 至 多 有 
M 中 的 一 条 边 与 v 关联 。 若 M 中 有 一 条 与 v 关联 
的 边 ,我 们 说 一 个 项 点 v 是 匹配 的 ;否则 ,v 是 不 匹 “ y * dde 
配 的 。 一 个 最 大 匹配 是 含有 最 多 边 的 一 个 匹配 ， 
即 对 于 任 一 匹配 M ,有 1M| 宇 IM'|。 在 本 节 中 ， 
将 聚焦 于 在 二 部 图 中 寻求 最 大 匹配 。 假 定 顶 点 集 
AH VAS RV =LUR Hp LAR 是 不 相交 的 且 E 中 的 所 有 边 都 连接 工 和 尺 中 的 顶点 。 
还 假定 V 中 的 每 一 个 顶点 至 少 有 一 条 边 与 之 关联 。 图 10-18 示例 了 匹配 的 概念 。 

图 10-18(a) 为 一 个 势 为 2 的 匹配 。 图 10-18(b) 为 一 个 最 大 匹配 ,其 势 为 3。 

在 二 部 图 中 寻求 最 大 匹配 问题 有 很 多 实际 的 应 用 。 作 为 一 个 例子 ,可 以 考虑 一 个 机 器 
集合 志和 一 个 需要 同时 执行 的 任务 集合 尺 。 对 一 台 具 体 的 机 器 wEL 及 其 能 执行 的 一 个 具 
WES vER 之 间 设 置 一 条 无 中 的 边 (x,u) 。 一 个 最 大 匹配 使 得 尽 可 能 多 的 机 器 得 以 运行 。 


10-18 一 个 二 部 图 G=(V,E)， 
点 划分 为 V=LUR 


@ 二 部 图 是 一 个 无 向 图 G 一 (V,E) ,其 中 V 可 以 分 成 两 个 集合 V1 和 V2, 使 得 (u,v) € E 蕴涵 着 x CV 且 vE Ve 
或 EV: 且 vEV1, 即 所 有 的 边 都 横 跨 集合 Vi 和 V2。 
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5. 寻求 二 部 图 的 最 大 匹配 


可 以 利用 EDMONDS-KARP 算 法 在 |V| 和 |E| 的 多 项 式 时 间 内 在 一 个 无 向 二 部 图 G— 
(V,E) 中 寻求 一 个 最 大 匹配 。 窍 门 在 于 构造 一 个 流 网 络 , 其 中 的 流 对 应 于 匹配 ,如 图 10-19 
所 示 。 

图 10-19(a) 由 图 6-15 中 的 图 G=(V,E) 得 来 的 二 部 图 ,其 顶点 划分 为 V= 工 UR. M 
带 阴影 的 边 表示 出 一 个 最 大 匹配 。 图 10-19(b) 对 应 的 流 网 络 及 其 一 个 最 大 流 。 每 一 条 边 
具有 一 个 单位 的 容量 。 带 有 阴影 的 边 具 有 流 1, 而 其 他 的 边 不 带 有 流 。 从 工 到 尺 的 带 有 阴 
影 的 边 对 应 于 二 部 图 中 的 最 大 匹配 。 对 二 部 图 G 如 下 定义 对 应 流 网 络 G" =V ,已 )。 设 源 
s 和 汇 : 不 是 V 中 顶点 的 新 的 顶点 ,并 设 V'=V U (s.0. 3 G 的 顶点 划分 为 V=L UR, 
G' 的 有 向 边 是 EE 中 的 边 设置 从 L 到 RR 的 方向 连同 V 条 的 新 边 : 

E' ={(su) :u€L) 
U {u,v) : «€ Loo € R, H (u,v) € E) 
U {@.t) s vE R} 


L R L R 
(a) (b) 


图 10-19 对 应 于 一 个 二 部 图 的 流 网 络 


为 完成 此 构造 ,对 E’ 中 的 每 一 条 边 指派 一 个 单位 的 容量 。 由 于 V 中 的 每 个 顶点 至 少 关联 一 
条 边 ,1E| 宇 |V1/2。 于 是 ,1E|<IE’|=|E| 十 |V1<3|E|, 所 以 |E’|=@(E)。 

引 理 11-8 说 明 在 G 中 的 一 个 匹配 直接 对 应 于 G 的 对 应 流 网 络 G 中 的 一 个 流 。 若 对 
所 有 的 (u,v)EVXV,f (u,v) 是 一 个 整数 , 则 称 流 网 络 G=(V,E) 中 的 一 个 流 /是 整数 
值 的 。 

引 理 10-8 设 G==(V,E) 为 一 个 二 部 图 ,其 顶点 划分 为 V=L U RH G —(V'. E^) 
为 其 对 应 的 流 网 络 。 若 M 是 G 的 一 个 匹配 , 则 在 G 中 有 一 个 整数 值 的 流 f, 使 得 |f|==|1M|。 
反之 ,车 f 是 G' 中 的 一 个 整数 值 流 , 则 在 G 中 有 一 个 匹配 M ERAMI =I Sl 

首先 说 明 G 中 的 一 个 匹配 M 对 应 于 G 中 的 一 个 整数 值 流 。 如 下 定义 流 f: 若 
Cus) EM, Wf Csu) — f. Cu — fCoD —1 以 及 fCGuss) — fCosi0 — f) — —1. XE E 
有 其 他 的 边 (u,v) EE' ,定义 f Cui) —0, AMES WE. S il AE ROSE PR AEE PR dl DL SY i 
性 质 。 

直观 地 看 ,每 一 条 边 (w,z)EM 对 应 于 G“ 中 通过 路 径 * 一 x 一 xz 一 : 的 流 的 一 个 单位 。 此 
外 ,由 M 中 的 各 条 边 诱 导出 的 各 条 路 径 除 了 s 和: 以 外 相互 没有 共同 的 顶点 。 跨 越 割 (L U 
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{s},R U {2} ) 的 净 流 等 于 |M|; 于 是 ,该 流 的 值 为 |f|=|1M|。 

反之 , 设 /为 G' 中 的 一 个 整数 值 流 ,并 设 Mm (Gies : u€ LS€ RI B. fQis 0770). 

对 于 每 一 个 顶点 xE 工 只 有 一 条 进入 边 , 即 (*,z), 且 其 容量 为 1。 于 是 ,对 于 每 一 个 xE 
L 至 多 有 一 个 单位 正 流 进 入 它 , 并 且 若 有 一 个 单位 的 正 流 进 入 该 顶点 ,根据 流 守恒 性 质 必 有 
一 个 单位 的 正 流离 开 它 。 并 且 因为 f 是 整数 值 的 流 , 对 每 一 个 vE 工 ,一 个 单位 的 流 至 多 由 
一 条 边 进 入 并 且 至 多 由 一 条 边 离 开 。 于 是 ,一 个 单位 的 正 流 进 入 u 当 且 仅 当 恰 有 一 个 顶点 
vER 使 得 /(u,v) 二 1, 并 且 对 每 一 个 w€EL, 至 多 有 一 条 带 走 正 流 的 边 离开 它 。 对 每 一 个 
VER 可 以 做 出 对 称 的 讨论 ,所 以 本 引 理 定义 的 集合 M 是 一 个 匹配 。 

为 领会 1M| 王 | f ,注意 对 每 一 个 得 到 匹配 的 顶点 EL H f(s,w) 二 1, 并 且 对 每 一 条 
边 (u,v)EE 一 M, 有 fQu)—0, Mili. 


IM|=>) Jf) = » p» fGQwu v) 


«€L v€R u€Lv€V'—L-isst] 
=>) (Du — X flav) — fuss) — flust)) 
«€L vev’ vel 
= Df DOD Maes — Mao 
u€LveV^ MEL v€L uEL “EL 
流 守 恒 性 质 蕴含 着 D DOS uo) = 0: LIU FO Pe te IU E DOS uo = 0 和 
uELvEV’ u€L v€L 


-Das = 9G: 且 由 于 没有 边 从 LL 到 1, 有 》)f (us) = 0。 于 是 ， 
“EL “EL “EL 
|M|= D Suss) 
“EL 


=D fu (因为 所 有 离开 s 的 边 都 进入 L) 


uev’ 
=f] (根据 | f | 的 定义 ) 
根据 引 理 10-8, 可 以 推导 出 二 部 图 G 的 一 个 最 大 匹配 对 应 于 其 对 应 的 流 网 络 G' 中 的 
一 个 最 大 流 , 并 且 可 以 因此 通过 在 G' 上 运行 最 大 流 算法 EDMONDS-KARP 而 计算 出 G 的 一 


个 最 大 匹配 。 


10. 5.2 程序 实现 


很 容易 在 C 中 实现 算法 10-15 过 程 EDMONDS-KARP。 


1 double * edmondsKarp(double * c.int n,int s,int t){ 
2 int u,v, * d, * pi; 

3 double * cí— (double * )malloc(n * n * sizeof(double) ) , 

4 * {= (double * )calloc(n * n.sizeof( double) ) ; 

5 Graph * gf; 

6 pair ps 

7 memcpy(cf,c,n * n * sizeof(double) ) ; 

8 gf=createGraph(cf,n); 

9 p=bfs(gf,s); 

10 “pi 一 (int* )p. first;d— (int * ) p. second; 

11 while(d[t]<INT_MAX){ /= 存在 增 广 路 径 * / 
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12 double cp— DBL MAX; 

13 v=t; 

14 u=pilv]; 

15 whileCu! =—1) / * TERT FAS FS HOR tH SB Is it / 
16 if(cfLu * nt+v]<cp) 

17 cp 一 ctLux ntv]; 

18 v—u; 

19 u— pil v]; 

20 ) 

21 for(v=t,u=pilv];u!=—1;v=u,u=pilv]){ 
22 cf[u * nt+v]-=cp; 

23 cf[v * n+u]+=cp; 

24 f[u * nt+v]+=cp; 

25 f[v * n+u]-=cp; 

26 ) 

27 free( pi) ;free(d) ; graphClear(gf) ; free( gf) ; 

28 gí— createGraph(cf n) ; 

29 p= bísCgf,s) ; pi (int * ) p. first; d— (int * ) p. second; 
30  } 

31 free(cf) ; freeC pi) ;freeCd) ; graphClear(gf) ; free( gf) ; 
32 return f; 

33) 


程序 10-14 ”实现 算法 10-15 过 程 EDMONDS-KARP 的 C 源 代 码 


对 程序 10-14 的 说 明 如 下 。 

(1) 函数 edmondsKarp 实现 算法 10-15 中 的 过 程 EDMONDS-KARP。 参 数 c 表示 流 网 
络 中 各 条 边 的 容量 构成 的 矩阵 ( 按 行 优先 原则 存储 在 一 维 数组 中 ) 。 参 数 n 表示 流 网 络 中 的 
顶点 个 数 。 参 数 s、t 分 别 表示 网 络 的 源 点 和 汇 点 。 与 算法 一 样 ,函数 将 计算 并 返回 由 容量 
矩阵 c 确定 的 流 网 络 的 一 个 最 大 流 {( 表 示 成 一 维 数组 的 矩阵 ) 。 

(2) 第 3 行 声明 的 动态 数组 cf 表示 计算 过 程 中 剩余 网 络 容 量 和 矩阵, 在 第 7 行 初始 化 为 
原 网 络 的 容量 矩阵 ce。 第 4 行 声 明 的 动态 数组 f 表示 计算 过 程 中 的 网 络 的 流 , 也 是 计算 结果 
的 最 大 流 的 存储 空间 ,初始 化 为 0 矩阵 (注意 调用 calloc 函数 为 其 分 配 空间 )。 第 5 行 声明 
的 Graph 型 指针 变量 g 用 来 表示 网 络 对 应 的 图 。 因 为 在 计算 过 程 中 需要 通过 对 这 个 图 进 
行 广度 优先 搜索 得 到 源 点 到 汇 点 的 增 广 路 径 。 

(3) 第 11 一 30 行 的 while 循环 实现 算法 10-15 中 第 5 一 14 行 的 操作 。 其 中 ,第 12— 
20 行 对 应 算法 中 第 7 行 计算 增 广 路 上 的 最 小 容量 cp。 第 21 一 26 行 的 for 循环 对 应 算法 中 
的 第 8 一 12 行 的 操作 ,计算 剩余 网 络 的 流 {。 第 28 行 和 第 29 行 对 应 算法 中 的 第 14 行 的 操 
TE ,对 剩余 网 络 对 应 的 图 g 做 广度 优先 搜索 。 

为 便于 代码 重用 ,把 程序 10-14 存储 在 文件 夹 graph 中 的 头 文件 edmodskarp. h( 函 数 
原型 声明 ) 和 源 文件 edmondskarp. c( 函 数 定义 代码 ) 中 。 
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10.5.3 应 用 


1. 因特网 带宽 
Internet Bandwidth 


On the Internet, machines (nodes) are richly interconnected, and many paths may 
exist between a given pair of nodes. The total message-carrying capacity (bandwidth) 
between two given nodes is the maximal amount of data per unit time that can be 
transmitted {rom one node to the other. Using a technique called packet switching, this 
data can be transmitted along several paths at the same time. 

For example, the following figure( 见 图 10-20) shows a network with four nodes 


(shown as circles), with a total of five connections among them. Every connection is 


labeled with a bandwidth that represents its data- eO 2m 
carrying capacity per unit time. 
In our example.the bandwidth between node 
1 and node 4 is 25. which might be thought of as 10 5 10 
the sum of the bandwidths 10 along the path 1-2- 
4.10 along the path 1-3-4,and 5 along the path 
1-2-3-4. No other combination of paths between 3 20 CO Datis 
nodes 1 and 4 provides a larger bandwidth. 图 10-20 网 络 图 


You must write a program that computes the 
bandwidth between two given nodes in a network, given the individual bandwidths of all 
the connections in the network. In this problem, assume that the bandwidth of a 
connection is always the same in both directions (which is not necessarily true in the real 
world). 

Input 

The input file contains descriptions of several networks. Every description starts with 
a line containing a single integer n (2 100), which is the number of nodes in the 
network. The nodes are numbered from 1 to n. The next line contains three numbers s.t, 
and c. The numbers s and ¢ are the source and destination nodes.and the number c is the 
total number of connections in the network. Following this are c lines describing the 
connections, Each of these lines contains three integers: the first two are the numbers of 
the connected nodes. and the third number is the bandwidth of the connection. The 
bandwidth is a non-negative number not greater than 1000. 

There might be more than one connection between a pair of nodes. but a node cannot 
be connected to itself. All connections are bi-directional.i. e. data can be transmitted in 
both directions along a connection, but the sum of the amount of data transmitted in both 


directions must be less than the bandwidth. 
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A line containing the number 0 follows the last network description. and terminates 
the input. 

Output 

For each network description. first print the number of the network. Then print the 
total bandwidth between the source node s and the destination node ¢, following the format 


of the sample output. Print a blank line after each test case. 


Sample Input Output for the Sample Input 


4 Network 1 
145 The bandwidth is 25. 


D 问题 描述 与 分 析 
因特网 上 任意 两 台 指 定 机 器 之 间 可 能 存在 着 多 条 路 径 。 它 们 之 间 的 “带宽 " 指 的 是 这 两 
个 结 点 间 在 单位 时 间 内 流 过 的 最 大 信息 量 。 此 问题 中 ,一 个 输入 案例 给 出 了 网 络 中 的 n 个 
m 结 点 , 若 两 个 结 点 有 直接 连接 , 则 给 出 连接 带宽 。 要 求 计算 源 
(QO) 结 点 * 和 目标 结 点 ! 之 间 的 带宽 。 若 将 计算 机 结 点 视 为 流 网 络 
G 中 的 顶点 ,任意 两 台 计算 机 uso 间 的 连接 视 为 两 个 顶点 v、 
" 10 间 的 双向 边 ,连接 的 带宽 视 为 边 上 的 容量 c[u,w], 则 问题 归 
结 为 对 给 定 的 流 网 络 G 及 指定 的 源 顶 点 s 和 汇 顶 点 4 计算 最 大 
流 的 问题 。 需 要 注意 的 是 , 题 中 给 出 的 一 对 顶点 u 和 间 的 带 
CE) 宽 实 际 上 给 出 了 网 络 流 中 的 两 条 边 (uo) 和 (ow) ,它们 具有 相 
图 10-21 网 络 流 图 。 同 的 容量 (带宽 )。 例 如 ,图 10-20 中 对 应 的 网 络 流 应 当 理解 为 
图 10-21。 
对 对 应 的 流 网 络 和 源 顶 点 和 汇 顶 点 调用 算法 EDMONDS-K ARP 过 程 就 可 解决 Internet 
Bandwidth 问题 。 
2) 程序 实现 


1 int mainO( 


2 int n,count=0; 

3 FILE * fl, * f2; 

4 assert(f1— fopen("chap10/Internet Bandwidth/inputdata. txt","r")); 

5 assert(2— fopen("chap10/Internet Bandwidth/outputdata. txt" ,"w")); 

6 fscanf(fl,"%d",&n); /* 读 取 案 例 个 数 nx / 
7 while(n) { 

8 int s.t msi, us vi 

9 double * c= (double * )calloc(n * n.sizeof(double)) ,w, * f; 


10 fscanf(f1,"% d% d% d", 8s, &t, &-m); 
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图 的 搜索 算法 


11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25] 


for(i 一 0;i 一 mi;i 十 十 ){ 
fscanf(f1,"%d%d%lf",&-u, &v, &w); 
c[(u 一 1) * n v- D]—c[ G— D * n 十 (u 一 1)] 一 ws 
) 
f=edmondsKarp(c,n,s—1,t—1)3 
for(w=i=0;i<n;it+) 
wt+=f[(s—D * nti]; 
ÍprintfCf2, " Network % d\n", ++count); 
fprintfCf2, "The bandwidth is %. 0f\n",w); 
free(c) ;free(f) ; 
fscanfCf1, "6d", & n); 
) 
felose(f1) ;fcloseCf2) ; 
return 0; 


程序 10-15 解决 Internet Bandwidth 问题 的 C 程序 


对 程序 10-15 的 说 明 如 下 。 
CD 第 7 一 22 行 的 while 循环 处 理 输入 文件 中 的 每 一 个 案例 。 其 中 ,第 3 行 声明 的 动态 
数组 < 用 来 表示 本 案例 数据 描述 的 流 网 络 容量 矩阵 ,初始 化 为 0 矩阵 (用 calloc 函数 分 配 空 


间 )。 


(2) 第 10 一 14 行 从 输入 文件 中 读 取 本 案例 的 数据 填写 网 络 的 容量 矩阵 ce。 第 15 行 调 
用 函数 edmondsKarp 计算 本 案例 的 最 大 流 f£. 
G) 第 16 行 和 第 17 行 计 算 流 工 的 值 | /= 91 Gs 1B 18 行 和 第 19 行将 计算 结果 
写 人 输出 文件 。 
程序 10-15 存储 在 文件 夹 chap10/Internet Bandwidth 中 的 源 文件 InternetBandwidth.c 中 ， 
读者 可 打开 文件 研读 ,并 试 运行 。 


2. 牛牛 的 美 餐 


vEV 


Dining 


Description 


Cows are such finicky eaters. Each cow has a preference for certain foods and drinks, 


and she will consume no others. 


Farmer John has cooked fabulous meals for his cows. but he forgot to check his menu 


against their preferences. Although he might not be able to stuff everybody.he wants to 


give a complete meal of both food and drink to as many cows as possible. 
Farmer John has cooked F (1<F<100) types of foods and prepared D (1<D<100) 
types of drinks. Each of his N (1<N<100) cows has decided whether she is willing to eat 


a particular food or drink a particular drink. Farmer John must assign a food type and a 


drink type to each cow to maximize the number of cows who get both. 
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Each dish or drink can only be consumed by one cow (i. e. , once food type 2 is 
assigned to a cow. no other cow can be assigned food type 2). 

Input 

* Line 1; Three space-separated integers: N.F.and D. 

* Lines 2.. N-- 1: Each line i starts with two integers F; and D; ,the number of dishes 
that cow i likes and the number of drinks that cow i likes. The next F; integers denote the 
dishes that cow i will eat.and the D; integers following that denote the drinks that cow i 
will drink. 

Output 

* Line 1: A single integer that is the maximum number of cows that can be fed both 
food and drink that conform to their wishes. 

Sample Input 

433 

221231 

222312 


221312 
21133 


Sample Output 
3 


1) 问题 描述 与 分 析 

牛牛 们 都 是 些 美食 者 。 每 个 牛牛 只 钟情 于 某 几 种 食物 和 饮料 ,而 对 其 他 的 食物 和 饮料 
视而不见 。 若 有 下 种 食物 ,D 种 饮料 ,把 一 种 食物 和 一 种 饮料 搭配 分 配给 一 个 牛牛 ,问题 是 
如 何 搭 配 能 最 大 限度 满足 牛牛 们 的 喜好 。 把 下 种 食物 视 为 二 
部 图 G 中 的 顶点 集 工 ,D 种 饮料 视 为 G "PISTE SE RS fT 
牛 喜欢 的 食物 和 饮料 可 视 为 连接 工 、R 的 边 。 例 如 题 中 输入 样 
例 可 表示 为 如 图 10-22 所 示 的 二 部 图 。 

这 样 ,问题 就 转化 为 计算 该 二 部 图 的 最 大 匹配 问题 。 

2) 程序 实现 


1 int main(){ 


2 intn,f,d,i; 

3 FILE * fl, * 2; ize ae 

4 double * fl, * c,max=0. 0; 

5 assert(f{1=fopen("chap10/Dining/inputdata. txt" ,"r")) ; 

6 assert({2=fopen("chap10/Dining/outputdata. txt" ."w")); 

7 fscanfCf1, " 4 d?6d Vd" , 8n. &.f, 8.0); /* 读 取 牛 牛 数 n、 食 物 数 人 饮料 数 dx / 
8 assert(c= (double * )calloc((f 十 d 十 2) * (f+d+2) .sizeof(double) )) ; 

9 for(i=1;i<=f;i+ 十 ) / * 添加 一 个 源 点 */ 

10  di]-1.0; 

11 for(i=1;i<=d;i+ 十 ) /* 添加 一 个 目标 点 */ 
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12 cLU+i) * (f 十 d 十 2) 十 f 十 d 十 可 一 1.0; 

13 for(i 一 0;i<nii 十 十 ){ /* 根据 二 部 图 创建 流 网 络 / 
14 int fi,di, * u, * v.p.q; 

15 fscanf({1,"% d% d" , &-fi, & di); 

16 assert(u= (int * ) malloc( fi * sizeofCinD)) ; 

17 assert v— (int * )malloc(fi * sizeof(int) )) ; 

18 for(p=0;p<fi;p++) 


19 fscanf(fl."%d" ,ut+p)s 

20 for(q=0;q<disq++) 

21 fscanf(f1,"%d",v+q); 

22 for(p=0;p<fi;p++) 

23 for(q=0;q<disqt+ +) 

24 cLulp] * (f+d+2)+f+v[q]]=1. 0; 

25 free(u) ;free(v) ; 

26 } 

27 fl=edmondsKarp(c,f+d+2,0,f+d+]); /* 计 算 最 大 流 x/ 
28 forG=0;i<f+d+2;i++) /* 计 算 最 大 匹配 */ 


29 max — fl(i]; 

30 fprintfCf2, " 95. ON n" , max) ; 
31 free(Cc) :freeCfD ; 

32 fclose(f1) ;fcloseCf2) ; 

33 return 0; 

34 } 


BF 10-16 f Dining 问题 的 C 程序 


对 程序 10-16 的 说 明 如 下 。 

CD. 由 于 食品 种 数 对 应 二 部 图 中 的 顶点 集 工 ,饮料 种 数 对 应 二 部 图 中 的 顶点 集 R, 所 以 
二 部 图 应 该 有 F 十 D 个 顶点 ,添加 一 源 点 和 一 汇 点 , 故 对 应 于 网 络 流 的 图 G 应 有 下 十 D 十 2 
个 顶点 。 于 是 ,程序 中 表示 流 网 络 容量 矩阵 的 数组 c 要 分 配 (f{ 十 d 十 2) * ({ 十 d 十 2) 个 单元 
(第 8 行 )。 源 点 为 0, 汇 点 为 {+d 十 1。 第 9 行 和 第 10 行 及 第 11 行 和 第 12 行 分 别 设置 定 源 
点 到 其 他 个 顶点 的 容量 为 1, 其 他 各 顶点 到 汇 点 的 容量 为 1。 

(2) 第 13 一 26 行 读 取 输 入 文件 中 每 个 牛牛 所 喜欢 的 食品 编号 及 饮料 编号 ,用 来 设置 网 
络 中 对 应 边 上 的 容量 ( 均 为 1) 。 

(3) 第 27 行 调用 函数 edmondsKarp 计算 c 对 应 的 网 络 的 最 大 流 £. 95 28 行 和 第 29 FF 
计算 该 流 的 值 |{fl ,第 30 行将 计算 结果 写 人 输出 文件 。 

程序 10-16 存储 在 文件 夹 chap10/Dining 中 的 源 文件 dining. c 中 ,读者 可 打开 文件 研 
读 , 并 试 运 行 。 
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在 信息 处 理 中 时 常 出 现在 一 个 文本 中 查找 一 个 模式 的 发 生 位 置 的 问题 。 例 如 ,文本 是 
正在 编辑 的 一 个 文档 ,要 查找 的 模式 是 用 户 提供 的 一 个 具体 单词 ,如 图 11-1 所 示 。 这 一 问 
题 称 为 串 匹 配 问题 。 图 11-1 的 目标 是 在 文本 TT 二 ABCABAABCABAC 中 查找 模式 P= 
ABAA 的 首次 发 生 。 该 模式 在 文本 中 仅 出 现 了 一 次 , 偏 移 量 为 * 一 3。 模式 的 每 一 个 字符 通 
过 一 根 竖 线 与 文本 中 匹配 的 字符 连接 ,所 有 匹配 的 字符 显示 有 阴影 。 设 所 有 合法 字符 构成 
的 集合 三 是 一 个 有 限 集 , 称 为 字母 表 。5* 表示 用 字母 表 5 中 的 字符 构成 的 所 有 有 限 长 度 
的 串 的 集合 。 零 长 度 空 串 用 e 表示 ,也 属于 三 。 人 们 将 文本 搜索 中 的 文本 和 模式 均 视 为 
=" 中 的 字符 串 。 


| 

A 
s-3— | 
T: [A] B[ cM 


123 4 


图 11-1 串 匹配 问题 


B| c| a| Ba] c 


s9 nnn 


3 4 
BIAIA 
| 
BIAIA 
5 6 7 


11.1 固定 模式 的 串 匹配 


固定 模式 是 指 组 成 模式 的 字符 及 模式 的 长 度 在 搜索 前 就 确定 了 。 该 问题 形式 化 描述 
如 下 。 

输入 : Dx 中 的 文本 字符 串 T [1 .nj 和 模式 字符 串 PLL. .mj],m<n。 

输出 : 车 有 O<s<n—m BH. T [st+1..st+m]=P[1..m]( BI 1<j<m.T [stj]= 
PL j D ,输出 首 个 这 样 的 偏 移 量 ;否则 输出 一 1。 


11.1.1 强力 算法 
对 文本 T [1. .站 和 模式 PEL. .mj 解决 串 匹 配 问 题 的 强力 算法 利用 一 个 循环 对 "一 mm 十 


1 个 可 能 的 * 值 的 每 一 个 检测 条 件 P[L1. .mj 二 TT[s 十 1..s 十 mj] 来 查找 首 个 有 效 偏 移 量 , 如 
图 11-2 所 示 。 


123 123 123 

P: [AJA] B P: [Al A| B P: [AT AB 

s0|x s-I X s || 

T: [Ale] A] A] B| C T: [A 加 a] A[ B] C] T: [A] C ATA[B| c 
| 23 45 6 123 45€ 13.3 4 $ 6 


(a) (b) (e) 
图 11-2 强力 串 匹 配 算法 对 模式 P— AAB 和 文本 T— ACAABC 的 操作 
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图 11-2 展示 了 对 文本 T= ACAABC 和 模式 P= AAB 运行 解决 串 匹 配 问 题 用 强力 算 
法 操作 的 情形 。 在 图 11-2(a) 中 s 二 0,P[1] 与 TLI] 匹 配 (用 坚 线 相连 ) ,但 是 P[2] 关 T[2]， 
遇 到 一 个 失 配 (用 一 个 又 表示 ),s AI 1 进入 图 11-2(b)。 在 图 11-2(b)P s— 1. P1] 
T[2], 又 遇 到 一 个 失 配 ,s 自 增 1, 进 入 图 11-2(c). ZEA 11-2(c) P 5—2. P[1]— T3]. 
P[2]=TL4],P[3] 王 TL5] ,得 到 一 个 完整 的 匹配 。 

将 此 想法 描述 成 伪 代 码 过 程 如 下 。 


NAIVE-STRING-MATCHER(T, P) 
1 n<lengthLT] 

2 m--length[ P| 

3 for s<-0 to n—m 

4 dok-—l 

5 while P[A]=T[s+k] 

6 do k=k+1 

7 if k>m 

8 then return s 
9 return — 1 


算法 11-1 计算 文本 为 T[1..nj]、 模 式 为 PL1..m] 的 串 匹 配 的 强力 算法 
NAIVE-STRING-MATCHER 过 程 的 运行 时 间 主 要 在 于 第 5 行 的 比较 运算 POO = 


T[s 十 kj 的 执行 次 数 ,最 坏 情 形 是 每 次 失 配 都 发 生 在 Pim] TEs +m Jab. BI s KAO 到 ?7 一 六 
Hl à — m1 个 取 值 匹 配 都 需 做 痉 次 比较 。 因 此 运行 时 间 是 O(n 一 m 十 Dm)( 见 图 11-3)。 


1234 1234 poros d 
P: [A[A[A[B P: (AAA P: [ATA[A[B 
s0 | | | x sl> | | | x s25| | Ix 
7: BAAM AL AT al alB 7T: [A AAAA] A[ a] Ay B. 7: [AT ATA[A[A[A] ay ^ 
103: 3 4 5 6 7 8 9 T2345 6 7 8 9 [3 3 4 5 678 9 
(a) (b) ©) 
12 3 4 1 3 4 1 3 4 
P: [A[A[A[B P: [ATA[A[B r: [ATA[A[B 
s3—> | | | x s4> | | | X s5—5 | | | | 
T: [a] A] AAPA) ADA] A| B T: [a] A[A[ADATATATA] B. T: [ATA[A[ATATATATAT[B 
13 3 4 5 678 9 13 3 4 5.6 7) 8 9 13 3 4 5 678 9 
(d) (e) (f) 


11-3 NAIVE-STRING-MATCHER 过 程 面 对 的 一 个 最 坏 情形 


图 11-3 展示 了 强力 匹配 算法 对 n==9,m 二 4 的 一 个 最 坏 情形 T = AAAAAAAAB, 
P=AAAB 的 执行 过 程 : 图 11-3(a) 一 图 11-3(f) 部 分 中 对 s 的 每 一 种 合法 取 值 (共有 6 个 
值 : 0,1,2,3,4,5) ,模式 的 每 个 元 素 ( 共 有 4 个 带 有 阴影 的 元 素 ) 都 要 与 对 应 的 文本 元 素 ( 带 
有 阴影 的 元 素 ) 进 行 比较 ,比较 次 数 为 6X4 一 24。 事 实 上 ,就 上 例 而 言 , 不 是 每 次 匹配 都 要 
比较 4 对 元 素 。 因 为 除了 第 一 次 匹配 时 比较 了 4 对 元 素 外 ,每 得 到 一 个 失 配 ( 第 一 次 出 现在 
s=0,i=4 处 ,最 后 一 次 出 现在 s 二 4,i 二 4 处 ) ,我 们 观察 到 ,模式 中 的 PL1..3] 是 与 文本 中 的 
T[s 十 1..s 十 3] 匹 配 的 ,并 且 P[1..3j 的 前 缀 P[1..2] 恰 为 T[s 十 1..s 十 3] 的 后 级 。 这 样 , 当 将 
偏 移 量 * AW 1 后 ,就 知道 TLs 十 1..s 十 2] 与 PL1..2j] 是 匹配 的 ,所 以 比较 可 以 从 
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i 二 3 开始 进行 。 这 样 ,就 只 需 比 较 两 对 元 素 (P[3]、T[s 十 3] 和 P[4]、T[s 十 4]) ,大 大 减少 了 
比较 的 次 数 ,如 图 11-4 所 示 。 


1234 1234 1203 4 
r: [Aj AT A[B P: [A[A[ A[ B] P: [A[A[ A[ B 
sol | | X si> | x s | x 

T: MAMAM alala] A[ B T: [ ABATATA[A[ A| A[ A[ B T: [A ABATA[A[A| A] A[ B 

12345 67 8 9 3/4 5 6 7 8 8 1234567 8 9 

(a) (b) (c) 

1234 1234 1234 

r: BAAS » RAAE P: AATE] 

s-3 | x 4 | x s-5— | 1 

T: [A] a] ABAAA] A| B T: [A] A] A ABAAA] B T: [a] a] AL ATA A[B 

123456789 12345678 9 103 3 4 5 6 7 8 9 


(d) (e) (f) 
图 11-4 利用 模式 自身 结构 提供 的 信息 改善 模式 匹配 的 运行 时 间 效 率 


图 11-4 展示 了 对 文本 T= AAAAAAAAB. fist P= AAAB 的 匹配 在 知道 了 模式 自身 
Iz P[1..2]  AA— P[2..3]. Hl P[1..3] — AAA 的 前 级 P[1..2] — AA HH 
P[1..3]— AAA 的 后 级 P[2..3] 的 前 提 下 ,每 次 * 移动 后 ,匹配 过 程 中 的 比较 次 数 可 大 大 减 
少 。 图 11-4(a) 中 模式 所 有 的 4 个 元 素 均 与 对 应 文本 元 素 比 较 , 图 11-4(b) 一 图 11-4(1) 部 
分 ,每 次 仅 对 模式 的 最 后 两 个 元 素 分 别 与 对 应 的 文本 元 素 进行 比较 ( 浅 色 阴影 部 分 )。 比 较 
次 数 为 4 十 2X5 一 14。 


11.1.2 KMP 算法 


由 此 可 见 , 利 用 模式 P[1..m] 本 身 结构 的 信息 ,对 于 2i m PLL. 1 ]09 8828 P[1..&] 
(<i 一 1) 若 同时 亦 为 PL1..i 一 菇 的 后 缀 P[i 一 &..i 一 1], 即 PL[1..k]==P[i 一 k..i 一 1] 可 以 提 
高 匹配 的 速度 。 设 x[ 门 为 P[1..i 一 1] 中 相等 前 后 级 的 长 度 最 大 者 , 即 

x[i] = max{k | 0 &  i—1 A P[1..k] = PLi—k..i—1)) (11-1) 
xLi HEA BE i 处 遇 到 失 配 时 ,确定 新 一 轮 匹 配 的 偏 移 量 和 比较 起 始 位 置 很 有 用 。 由 于 失 配 
HAERE ~m 内 的 任何 位 置 ,我 们 需要 计算 [1..m]。 而 i 二 1 的 情形 并 不 包含 在 
式 (11-1) 中 ,约定 [1 二 0。 此 后 ,将 x[1..mj 称 为 模式 P[1..z] 的 失 配 函数 。 

下 面 ,以 模式 PL1..7]— AABAABC 为 例 ,考察 其 失 配 函数 x[1..7]。 

i=1 时 , 按 上 述 约定 x[1]=0。 

i=2 时 ,P[1..i 一 1] 二 A, 前 级 为 {e} ,后 级 为 {e} ,前 后缀 最 长 公共 串 为 s, 其 长 度 人 一 0， 
x[2] 一 A 一 0。 

i=3 时 ,P[1..i 一 1] 二 AA, 前 级 为 {A}, 后 级 为 {A}) ,前 后 缀 最 长 公共 串 为 A, 其 长 度 
k—1.z[3]—&—1, 

i=4 W}, P[1..;—1]— AAB. WALA, AA} JG ONL AB. B) N Ue BRK ASE 
,其 长 度 & 一 0,x[4] 一 上 一 0。 

i—5 W}, P[1..;—1]— AABA . fj Jg (A. AA, AAB} ,后 绥 为 {ABA, BA, A}. fil Ja 
绥 最 长 公共 串 为 A, 其 长 度 一 1,x[5] 一 4 一 1。 
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i=6 If, P[1..i 一 1] 二 AABAA, 前 级 为 {( A, AA, AAB, AABA}, Ja H { ABAA, 
BAA, AA, AJ ,前 、 后 绥 最 长 公共 串 为 AA, 其 长 度 & 一 2,r[6] 一 k=2. 

i 二 7 时。P[1..i 一 1] 二 AABAAB, 前 级 为 {A, AA. AAB, AABA, AABAA}, JAAA 
{ABAAB, BAAB, AAB, AB. B) ,前 、 后 级 最 长 公共 串 为 AAB, 其 长 度 人 一 3,r[7] 一 A 一 3。 

对 任意 模式 P[1..m] 的 失 配 函数 x[1..m] 的 计算 方法 稍 后 详细 讨论 ,此 处 假定 算法 过 
程 为 GET-PICP) , 它 计算 并 返回 模式 P 的 失 配 函数 +。 匹配 过 程 中 若 在 i 处 得 到 一 个 失 
配 ,函数 值 x[ 丫 在 准备 下 一 轮 匹配 的 偏 移 量 s 和 比较 开始 位 置 i 的 作用 如 图 11-5 所 示 。 


i-l ; 
[xima] i 
| i-l-n[i] 
P Le y - 


ai] | - ni] 
— — —— — —— — — — 
=| 


T 


a{i}+1 


s+i-1-x{i] —| 
(b) 
图 11-5 在 位 置 i 失 配 后 确定 新 一 轮 匹配 的 偏 移 量 s 和 比较 起 始 位 置 ; 时 i109 C 


图 11-5 展示 了 在 位 置 i 处 遇 到 失 配 后 ,如 何 用 由 式 (11-1) 定 义 的 x[ 站 确定 下 一 轮 匹配 
的 偏 移 量 s 和 比较 开始 位 置 i。 图 11-5(a) 表 示 在 一 轮 匹配 过 程 中 ,P[1..i 一 1]==T[s 二 1..s 
+i—1] 48 PU] 关 T[s 十 让。P[1..i 一 1] 在 图 中 表示 成 粗 线 。 根 据 x[ 门 的 定义 ,P[1..i 一 1] 
可 分 成 三 部 分 : PLI. xD] ]; PExÉ]-1..;— nli] 1] P[i 一 x[ij..i 一 1]。 其 中 前 后 两 部 
分 相等 ,表示 成 黑色 的 ,中 间 部 分 表示 成 灰色 的 。 在 文本 工 中 ,由 于 T[s 十 1..s 十 i 一 1]= 
P[1..i 一 1], 对 应 部 分 也 表示 成 同样 的 形式 。 图 11-5(b) 表 示 下 一 轮 新 的 匹配 开始 时 , 偏 移 
量 可 调整 到 s 十 i 一 1 一 x[ 门 处 。 这 是 因为 [可 记录 的 是 P[1..i 一 1] 中 相等 前 后 级 最 长 者 的 
长 度 , 所 以 Tis +1..st+i—1]}(= P[1..i 一 1]) 中 不 存在 与 PL1..mj 的 任何 长 于 xi 100 nr 2t 
匹配 的 可 能 。 对 新 的 偏 移 量 s TLs 十 1..s 十 x[ 疏 ] 二 PL[1..x[ 门 ]。 这 是 因为 这 对 应 着 图 11-5 
(a) 中 文本 的 第 二 根 粗 黑 线段 , 它 和 同样 表示 成 粗 黑 线段 的 PCL. eli p s]. Sr DUE UG 
配 过 程 中 可 以 不 再 比较 两 者 的 对 应 字符 ,而 从 Le] FP i 调整 为 x[ 门 十 1。 

需要 说 明 的 是 有 一 个 例外 , 当 失 配 发 生 在 i1 处 , 即 T[s 十 1J] 关 PL[1]。 这 时 ,由 于 我 们 
人 为 地 记 x[1] 为 0, 所 以 这 一 情形 不 能 运用 图 11-5 的 所 示 方式 确定 下 一 轮 匹配 的 偏 移 量 s 
和 比较 开始 位 置 i。 幸 运 的 是 ,这 种 情况 意味 着 下 一 轮 匹配 应 该 从 文本 的 下 一 个 字符 开始 
与 模式 的 从 第 一 个 字符 开始 依次 比较 , 即 让 偏 移 量 s 自 增 1, 而 i 保持 为 1。 

将 上 述 利用 模式 的 失 配 函数 改善 匹配 过 程 的 思想 写成 如 下 伪 代码 。 


KMP(T, P, x) 
1 n=|T|,m<| P| 
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2 x<-GET-PI(P) 

3 s<0, i1 

4 while s+i<n 

5 doif T[s--i]—P[i] 


6 then i<-i+1 

7 if im 

8 then return s 

9 else if i=1 

10 then s<s+i 

11 else ss +Ci—1) — aL] 
12 icai] 


算法 11-2 ”改进 的 串 匹 配 算法 


设 文本 T[1..23]— ABC ABCDAB ABCDABCDABDB, 模 式 P[1..7]=ABCDABD, f 
sk P 的 失 配 函数 [1..7]— (0.0,0,0,0,1,2), Al 11-6 展示 了 运行 KMPCT, P, x) t 
过 程 。 

图 11-6(a) 中 , 初始 时 s=0, M i 二 1 开始 依次 比较 模式 与 文本 的 对 应 字符 TEs +i 
PLi]. Æi=4 处 T[s-i]- T[4]— * "*D"—P[4]— P[i].388]—^ A B8. HIT x[i]— 
7[4]==0, 所 以 将 s BB s+ G—1)—aliJ=0+3—0=3 处 , 重 置 i [i] 9-1—1. 

图 11-6(b) 中 , 此 时 s=3, 从 i— 1 开始 ,继续 依次 比较 。 马 上 过 到 失 配 : T[s* 十 可 = 
T[4]=“” 关 “A”=P[1]=P[ 门 。 由 于 i=1, 这 意味 着 需要 立即 将 s 推进 一 个 位 置 , 移 到 
s 十 1 一 4 处 ,保持 i=1。 

图 11-6(c) 中 , 此 时 s=4, M i= 1 开始 继续 依次 比较 。 在 i=7 处 ,T[s 十 可 =TL11] 一 
* "z*"p"— p[7]— PLi] BAAR. hF xL] 2[7]—2. s 移 到 s 十 (i 一 1) 一 nli] 
8, 重 置 i 为 cli]+1=3. 

图 11-6(d) 中 , 此 时 s 二 8, 继 续 从 i 二 3 开始 依次 比较 。 马 上 遇 到 一 个 失 配 : T[11]= 
“ "z*C"—p[3]. BT i1. Brit s 为 * 十 (i 一 1) 十 xli]=10,i=x[i]+1=1. 

图 11-6(e) 中 , 此 时 *=10,i 一 1, 继 续 依次 比较 。 在 i=l 处 ,T[s 十 让 =T[11]==“” 关 
*A"—P[1]— PLi].38 8] — 4 A Be. HP i—1 与 图 11-6(b) 中 的 情形 一 样 。 将 ; 移 到 
s+1=11 处 ,保持 i=1。 

Fl] 11-6CD P, 此 时 s= 11, A i— 1 开始 继续 依次 比较 。 在 i=7 AB. T[18] — "C" 
*D"— P[7 3B SI B, x[i]—2[7]—2.35 s BB s--G—1)— z[i]— 15, 重 置 i—n[i]4-1—3. 

Fd 11-6Cg) P. 5— 15 BE. M i= 3 开始 继续 依次 比较 。 这 次 得 到 一 个 完整 的 匹配 。 于 是 
文本 工 中 模式 已 首次 出 现在 偏 移 量 *=15 处 。 

整个 过 程 的 最 基本 操作 就 是 第 5 行 , 即 在 偏 移 量 为 * 时 ,对 满足 1m H stin 的 
当前 i 比较 TLs 十 可 与 P[ 可 。 根 据 比 较 的 结果 下 次 比较 操作 前 ,会 有 3 种 情形 之 一 发 生 。 

CD Ts i]-— Pi]. BR T FI 11-6(b)、 图 11-6(d) 和 图 11-6(e) 一 开始 就 遇 到 失 配 外 ， 
其 他 的 图 11-6(a) 、 图 11-6(c) 和 图 11-6(f) 在 遇 到 失 配 前 以 及 整个 图 11-6(g) 都 处 于 此 种 情 
形 。 此 时 只 需要 让 i 自 增 1( 第 6 行 ), 并 检测 i 是 否 大 于 m。 若 是 ,意味 着 找到 了 一 个 完整 
匹配 ,返回 偏 移 量 *( 第 7 行 和 第 8 行 )。 
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DIAlB| [A|B|Cc|D[| A|B| C] D] Al BID] B 
* 9 9g BIO NUM 9 0 2 2 23 


(a) 


r: M B| c[ D[ a] B] D 


s=l> x 
7: [A[B[c[-TA[B|c[n[A[B| [al Bi cl pl al B[ Cc] p[A| B| np B 
103.3 4 5 678 MNB ISi 8 9 0A 2 3 


(b) 


T: A[B[c[p[A[B[ p[B 
16 7 18 19 20 21 22 23 
T A|B|c[p|A[B[p|B 
16 7 18 19 20 20 22 23 
(d 
12 3 4 5 6 7 
r: [A[ B| c[ DI a] B[ p 
s-10— x 
r: [A[B[c] [a] Bi c/p] a BE a] B| co] A[ B| c, bp, a] B| p[ B 
133 4 $ 678 9 ON RE MWS 67 WW 2 1 wD 2 
T 
T 


11-6 运行 KMP(T，P,x) 的 过 程 


(2) Tlst+iJAPLi], H i=1. K 11-6(b) 和 图 11-6(e) 就 是 这 种 情形 。 这 意味 着 一 轮 
匹配 开始 就 失败 了 。 这 时 要 做 的 就 是 自 增 1, 且 i 保持 为 1( 第 9 行 和 第 10 行 )。 

(3) T[sci]z PLi]. A iz 1, RRR E TE SE UC Be e i> 1 处 失 配 ,由 于 x[ 门 表示 
P[1..i 一 1] 的 前 级 POL. [li] PLi 一 x[C..i 一 菇 是 相同 的 ,所 以 可 以 将 * 直接 推进 (i 一 1) 
sali]. H i 可 从 x[ 可 十 1 开始 进行 下 一 轮 匹配 (第 11 行 和 第 12 行 )。 
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在 匹配 过 程 中 ,文本 T[1..n] 中 只 有 发 生 TES i] PL] B i1 时 的 文本 中 元 素 
TEs Hilt Hy RE HET SF 1 次 的 比较 .如 图 11-6(a)、 图 11-6(c) 和 图 11-6(d) 中 的 情形 。 这 
是 因为 在 此 情形 下 ,第 11 行 和 第 12 行 的 操作 将 s Ai 分 别 调整 为 s 十 (i 一 1) 一 x[ 门 和 
zLi]--1. s 由 所 长 而 i 有 所 减 ,两 者 之 和 却 不 变 ( 还 是 s 十 i)。 其 他 所 有 的 元 素 仅 做 一 次 比 
较 。 上 例 中 的 TL4]、TL11] 就 是 这 样 的 元 素 , 其 中 T[4] 比 较 了 2 次 ,T[11] 比 较 了 3 次 。 假 
定 T[d]j 是 这 样 的 元 素 , 首 次 比较 操作 时 , 偏 移 量 为 ;, 对 应 模式 中 的 元 素 为 PLI]. 第 2 次 比 
较 时 ,s 有 所 增长 ,但 必 小 于 +:。 如 果 有 第 3 次 比较 ,也 是 如 此 。 因 此 ,重复 比较 次 数 至 多 为 
1 一 s( 首 次 比较 时 的 值 )。 由 1 和 的 单调 增长 性 可 知 ,所 有 这 样 的 元 素 重复 比较 次 数 之 和 必 
不 会 超过 n。 加 上 至 多 nn 个 仅 比 较 一 次 的 元 素 , 算 法 KMP 中 第 4 一 12 行 while 循环 的 重复 
次 数 至 多 为 2n 次 。 

接 下 来 ,我 们 来 考虑 对 一 般 的 模式 P[1..mj 计 算 其 失 配 函数 x[1..m] 的 过 程 GET-PI(P)。 
WA a[1]—2[2]—0, XT i>2, 设 已 知 x[1..i 一 1] 且 x[i 一 1]=k, 即 P[1..i 一 2] 的 前 .后 
Apek AI pE P[1..&], 即 P[1..&]==P[i 一 k 一 1..i 一 2], 要 计算 ali]. 

CD 此 时 车 有 P[k 十 1]==P[i 一 1], 则 必 有 P[1..& 十 1]==P[i 一 k 一 1..i 一 1], 且 不 会 有 
ko 之 十 1 使 得 P[1..&']= 二 P[i 一 k..i 一 1]。 因 此 可 得 到 x[ 门 =k 十 1==x[i 一 1] 十 1。 

(2) # P[k 十 1] 关 PLi 一 1], 又 要 分 两 种 情况 : 其 一 ,k 二 0, 此 时 , 必 有 x[ 门 =0; 其 二 ， 
k>0, MEI 11-7 所 示 。 


1 2 mm R H 


图 11-7 B% z[i—1]—&20,.11 I nli] 


这 意味 着 PL1..;— 1109 JRA B RA K HE EC EE MAE 11-7 中 可 见 ， 
P[L1.. 一 菇 的 前 后 绷 的 最 长 公共 串 除 了 最 后 一 个 元 素 为 PLi 一 1] 以 外 ,其 他 部 分 应 该 是 
PL1..k&]( 灰 色 阴 影 部 分 元 素 ) 的 前 后 级 的 公共 串 。 所 以 ,k 的 值 可 以 从 x[kj 起 ,递减 地 检测 
算得 。 

将 这 些 思考 写成 如 下 的 对 模式 PL1..m] 计 算 失 配 函数 x[1..mj 的 过 程 。 

GET-PI(P) 

1 m--length[ P] 

2 z[1]-72(2] <0 

3 i<3, k<-x[i—1] 

4 while i<m 

5 do if PLi—1]=P[k+1] 


6 then i<-i+1 

7 xli]<k+1 

8 k-—ktl 

9 else if k>0 

10 then k<-x[k] 
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11 else x[i]<-0 
12 i-—itl 
13 return x 


算法 11-3 HARR P[1..m] 的 失 配 函数 x[1..m] 的 算法 


算法 11-3 的 运行 时 间 由 第 4 一 12 行 的 while 循环 的 重复 次 数 决定 。 该 循环 的 循环 条 
件 决 定 了 至 少 重复 m—1 次 ( 若 第 5 行 检 测 的 条 件 成 立 或 P[k 十 1] 隆 PL[i 一 1] 且 二 0) ,每 次 
这 样 的 重复 必 执 行 i 的 自 增 1 操作 。 换 名 话说 ,过 程 要 执行 m 一 1 次 & 的 自 增 1 操作 。 在 这 
m 一 1 次 伴随 着 i 自 增 1 的 操作 ,第 8 行 & 也 执行 了 自 增 1 的 操作 。 在 整个 循环 的 重复 过 程 
中 第 10 行 要 执行 & 的 减 小 操作 (因为 z[k] 二 k)。 然 而 ,无 论 何 时 ,k JEM. 所 以 第 10 行 的 
操作 次 数 必 不 会 超过 mr 一 1。 因 此 ,算法 GET-PI(P) 的 运行 时 间 为 86(m)。 回 到 算法 
KMP(T，P) ,我 们 知道 其 中 第 4 一 12 行 while 循环 耗 时 为 O) ,加 上 现在 知道 其 中 第 2 行 
执行 GET-PICP) 耗 时 86) ,所 以 KMP 的 运行 时 间 为 6(n 十 m)。 由 于 必 有 模式 的 长 度 不 
超过 文本 的 长 度 , 即 mn he KMP 算法 的 运行 时 间 可 表示 为 O). 

顺便 说 明 , 上 述 算法 之 所 以 称 为 KMP 算法 ,是 因为 该 算法 是 由 是 由 Knuth, Pratt 和 
Morris 各 自 独立 发 明 的 。 


11.1.3 程序 实现 


C 语言 为 程序 员 提 供 了 大 量 的 字符 串 处 理 库 函 数 , 包 括 常 用 的 计算 串 长 度 函 数 串 连接 
函数 、 取 子 串 函数 , 串 比 较 函 数 等 。 同 时 还 提供 字符 串 匹 配 函 数 strstr, 该 函数 的 用 户 接口 
A. 


char * strstr(char * strl, char * str2); 


PARK strstr 表示 在 第 一 个 参数 表示 的 串 str] 中 查找 第 二 个 参数 表示 的 串 str2 第 一 次 出 现 
的 位 置 指针 (与 本 节 中 定义 的 偏 移 量 s 稍 有 差别 ) ,并 以 该 指针 作为 返回 值 。 

我 们 实现 了 KMP 算法 , C 代码 写 在 源 文件 textmatch. c 中 ,该 文件 存储 于 utility 文件 
夹 中 ,读者 可 打开 该 文件 研读 。 为 节省 篇 幅 此 处 就 不 再 详细 列 出 代码 了 。 


11.1.4 应 用 


DNA Laboratory 

Description 

Background 

Having started to build his own DNA lab just recently. the evil doctor Frankenstein is 
not quite up to date yet. He wants to extract his DNA. enhance it somewhat and clone 
himself. He has already figured out how to extract DNA from some of his blood cells. but 
unfortunately reading off the DNA sequence means breaking the DNA into a number of 
short pieces and analyzing those first. Frankenstein has not quite understood how to put 


the pieces together to recover the original sequence. 
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His pragmatic approach to the problem is to sneak into university and to kidnap a 
number of smart looking students. Not surprisingly. you are one of them. so you would 
better come up with a solution pretty fast. 

Problem 

You are given a list of strings over the alphabet A (for adenine), C (cytosine), G 
(guanine), and T (thymine) ,and your task is to find the shortest string (which is typical- 
ly not listed) that contains all given strings as substrings. 

If there are several such strings of shortest length. find the smallest in alphabetical/ 
lexicographical order. 

Input 

The first line contains the number of scenarios. 

For each scenario, the first line contains the number n of strings with 1 nx 15. 
Then these strings with 1< length<100 follow. one on each line. and they consist of the 
letters “A”,“C”, “G”, and “T” only. 

Output 

The output for every scenario begins with a line containing "Scenario #i:”, where i is 
the number of the scenario starting at 1. Then print a single line containing the shortest 
(and smallest) string as described above. Terminate the output for the scenario with a 
blank line. 

Sample Input 

1 

2 

TGCACA 

CAT 

Sample Output 

Scenario #1; 

TGCACAT 


l. 问题 描述 与 分 析 


给 定 一 系列 由 字母 表 {A( 腺 味 叭 ) C OIL PERIERE ) GC BEI) , 工 (胸腺 喀 啶 )} 中 字符 构 
成 的 DNA 串 , 找 出 包含 所 有 这 些 串 作为 子 串 的 最 短 串 。 如 果 有 若干 个 这 样 的 串 He 
则 取 最 小 者 。 

为 解 此 问题 , 先 观察 如 下 事实 。 

设 z[1..z]、y[1.. 四 为 两 个 字 串 。 

CD 38 y J& x 的 子 串 , 则 包含 ry HEB Ne, Harkey 的 子囊, 则 > 是 包含 zx 、y 
的 最 短 字 串 。 

(2) it y JE x 的 子 串 上 且 z 也 不 是 y 的 子 串 , 且 令 
lı = max{k | x[1..£] = yln— k +1..n]}, lı = max{k | z[m — k +1..m] = y[1..2]} 

(11-2) 
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Hl KR x. y 的 前 、 后 级 的 最 长 公共 串 的 长 度 ( 见 图 11-80 a)) 412 表示 y、z 的 前 、 后 级 的 
最 长 公共 长 度 ( 见 图 11-8000. E 52 b WAR zy WRF BA y Ln] xL + 
1..m ] EWE 4570 ,为 z[1..z] 十 y[2 -1..].. WF h=, W y C1. ]9- x [4 3-1. m ] fl 
Zz[1..m] 十 yLls 十 1..nj 都 是 包含 x、y 的 最 短 字 串 。 


x[ P «dl 
f D 
1 l m 
[ I I ] 
L n-ll 了 
yila] 
(a) 
x[1..m] 
A 
( h 
1 m-ly+1 m 
[ I I ] 
1 l n 
k J 
bg 
yt] 


(b) 
图 11-8 最 长 公共 串 的 长 度 


下 面 以 输入 样 例 的 数据 为 例 说 明 此 结论 。 此 处 r= "TGCACA". y — *CAT".m— 6, 
?一 3。 由 于 z[1..1]= y[3..3]2 " T",4, 一 1。y[1..2] 一 z[5..6] 一 “CA”, 故 2 一 2。 由 于 
1; 7271-—h ,所 以 以 “TGCACA” 和 CAT? 为 子 串 的 最 短 字 串 是 [1.6 ]-- y[3..3] 7 * TG- 
CACAT”. 


2. 算法 描述 
根据 上 述 结果 ,将 计算 包含 两 个 字 串 xz、y 的 最 短 字 串 过 程 描述 如 下 。 


SHORTESTSTRINGCz，y) 

lif y 是 xz 的 子 串 

2 then return x 

3 让 zx 是 y 的 子 串 

4 then return y 

5 lL<-max{k|z[1..k]=y[n—k+1..n]} 

6 ls<—max{k|z[m—k+1..m]=y[1..&])} 

Tif hh 

8 then return z[1..9m]-- y 5 -1..5] 

9 else if /; —/ 

10 then return y[1..5]--z[4  1..m] 
11 return y[1.. 四 十 z[ 9-1..m]& x[1..m]2- y 4; 4-1..2] 


算法 11-4 计算 包含 字符 串 cy 的 最 短 字 串 过 程 


对 本 题 中 的 一 个 案例 ,假定 个 DNA 串 存 放 在 数组 DNAS[1..n] 中 。 我 们 用 如 下 的 贪 
禁 策 略 解决 此 问题 : current-solutions 从 DNAS[1] 开 始 , 依 次 计算 包含 current-solutions 
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HRA DNASLi JG =2. 3, +. n) 两 者 的 最 短 子 串 ,计算 所 得 的 result 添加 到 new-solu- 
tions 中 ,并 用 new-solutions 更 新 current-solutions。 最 终 current-solutions 的 最 小 者 即 为 


所 求 ,写成 伪 代 码 过 程 如 下 : 


DNA-LABORARY(DNAS) 
ln<-length[ DNAS] 

2 current-solutions-- ( DNASL1]) 
3 for i<-2 ton 


4 do new-solutions— Z 

5 length<-c° 

6 for each string in current-solutions 

7 do result<-SHORTEST-STRING (string, DNAS[i]) 
8 if result 中 串 长 不 超过 length 

9 then if result 中 串 长 小 于 length 

10 then length<result PRK 

11 newsolutions— Ø 

12 neuxsolutions *-neuxsolutions U result 

13 current-solutions *-neursolutions 

14 SORT(current-solutions ) /* 按 字典 顺序 排序 


15 return current-solutions[1] 


算法 11-5 解决 DNA Laborary 的 算法 过 程 


这 是 一 个 渐 增 型 算法 ,第 3 一 10 行 的 for 循环 维持 的 循环 不 变量 是 : 在 第 3 行 和 第 4 行 
的 for 循环 的 每 次 重复 之 初 , current-solutions 是 包含 DNAS[1]…DNAS[i 一 1] 的 最 短 子 
PER. 

利用 此 循环 不 变量 ,很 容易 证 明 此 算法 是 正确 的 。 


3. 程序 实现 


要 实现 算法 11-4, 需 要 有 一 个 计算 式 (11-2) 中 定义 的 串 ry 的 最 长 前 后 缀 公共 串 长 度 
的 函数 。 


1 size_t pre post fix(char * x, char * y){/ * 计算 max(&lz[1..£]— y[n—&k--1..]) * / 
size t m=strlen(x), n=strlen(y), l=m<n? m:n; 
char * subx= (char * ) malloc(1 * sizeofC char) ) , 

* suby= (char * ) malloc(l * sizeof(char) ) ; 


2 

3 

4 

5 k; 
6 while (1>0) ( 

7 strncpy(subx, x, 1), strnecpy(suby, y+n—l, D; 
8 subx[1]— suby[1]—0; 

9 if(stremp(subx, suby) — —0) 

11 E; 

12 ) 

13 free(subx) ; freeCsuby) ; 
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14 return l; 
15 } 


程序 11-1 计算 字符 串 zx、y 的 前 、 后 级 最 长 公共 串 长 度 的 C 函数 
函数 pre. post. fix 从 xr vy 的 长 度 较 小 者 1 开始 递减 地 逐一 检测 x[0..1 一 1] 与 y[n 一 


L..n 一 1] 是 否 相 等 ,第 一 次 检测 到 该 条 件 成 立时 的 7 值 即 为 所 求 (第 6 一 12 行 的 while 循环 )， 
第 14 行将 其 返回 。 利 用 该 函数 ,可 将 算法 11-4 实现 如 下 。 


1 LinkedList * shortest common str(char * x, char * y){ 


2 size t m=strlen(x), n=strlen(y); 

3 char * r— Cchar * )calloc(m+n+1, sizeofCchar)) ; 

4 LinkedList * L=createList(m+n+1,stremp) ; /* 创建 字符 串 类 型 链表 * / 
if(strstr(x, y)){ /*y FE x FB * / 

6 listPushBack(L, x); 

7 Jelse if(strstr(y, x)){ /* xt y NFB * / 

8 listPushBack(L, y); 

9 Jelse( 

10 size t ll—pre post fix(x, y), l2— pre post fixCy, x); 

1 if(11>12){ /* 返 回 y[1..m] 十 x[L11 十 1..m] * / 
12 strepy(r, y); 

13 strepy(r+n, x+11); 

14 listPushBack(L, r); 

15 Jelse if(11<12) { /* 返 回 x[1..m] 十 y[12 十 1..n] * / 
16 strcpy[rs x); 

17 strepy(r+m, y+12); 

18 listPushBack(L, r); 

19 }else (/ * 3 BI y[1..n] 十 x[11 十 1..mJ 和 x[1..m] 十 y[12 十 1..n] * / 
20 strepy(r, y); 

21 strcpy(r 十 n，x 十 11); 

22 listPushBack(L, r); 

23 strcpy(r, x); 

24 strcpy(r3- m, y+12); 

25 listPushBack(L, r); 

26 } 

27 ) 

28 return L; 

29) 


程序 11-2 实现 算法 01-4 的 C 函数 


对 程序 11-2 的 说 明 如 下 。 

CD 由 于 返回 值 可 能 只 有 一 个 串 (y[0..n 一 1 十 x[11..m 一 1] 或 x[0..m—1]-- y12..n— 1D . 
也 可 能 是 两 个 串 (y[0..n 一 1 十 x[11..m 一 1] 或 x[0..m] 十 y[12..n 一 1]), 故 用 一 个 链表 来 存 
储 返回 值 。 因 此 ,函数 的 返回 值 类 型 为 链表 指针 LinkedList * (2. 1. 3 节 定 义 )。 

(2) 第 5 一 9 行 实现 算法 11-4 中 的 第 1~4 行 的 操作 。 此 处 调用 C 的 库 函 数 strstr 来 检 
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测 x 是 否 为 y 的 子 串 ( 第 5 行 strstr(x, y)) 或 y 是 否 为 x 的 子 串 (第 7 行 strstr(y, x))。 

(3) 第 9 一 27 行 实现 算法 11-4 中 的 第 5 一 10 行 的 操作 。 此 处 调用 程序 11-1 中 定义 的 
函数 pre_post_fix, 计 算 x y 的 前 后 绥 最 长 公共 字 串 长 度 11 和 y ox B B Je PH I A Jet a 
长 度 12( 第 10 行 )。 由 于 对 不 同情 形 下 的 返回 值 时 存储 在 链表 L 中 ,所 以 统一 地 在 第 28 fT 
将 工 返回 。 

利用 程序 11-2 定义 的 函数 shortest_common_str, 将 算法 11-5 实现 如 下 。 

1 char * dna laborary(char * dnas[], int n){ 

2 char * r— (char * )calloc(100, sizeof(char) ) ; 

3 LinkedList * currentSolution=createList(100, stremp) ; 

4 listPushBack(currentSolution, dnas[0]) ; 

5 for(int i=1; i<n; i 十 十 ){ 

6 LinkedList * newSolution=createList(100, stremp) ; / * 设置 newSolution 为 空 集 * / 
7 
8 
9 


int length=200; / * newSolution 中 串 的 长 度 * / 
ListNode * a 一 currentSolution->nil->next; /x#*a 指 向 currentSolution 的 首 结 点 * / 
while (a! —currentSolution-» nil) { / * 对 currentSolution 扫描 */ 

10 char * string—a-» key; / * 存储 在 currentSolution 中 当前 串  / 

M LinkedList * result— shortest common str(string. dnas[i]); 

12 ListNode * b= result-» nil-» next; 

13 if(strlen(b-> key) — = length) ( 

14 if(strlen(b-> key) — length) ( / * r PB EG newSolution 中 串 更 短 * / 

15 length— strlenCb-» key) ; 

16 clrList(newSolution, NULL); 

17 newSolution=createList(100, stremp) + 

18 } 

19 ListNode * c= result-» nil-» next; 

20 while(c! = result-» nil) ( /*# 将 rr 中 串 加 入 newSolution * / 

21 listPushBack( newSolution, c-» key) : 

22 c—c-»next; 

23 ) 

24 ) 

25 clrListCresult, NULL); 

26 a=a->next; 

27 } 

28 clrList(currentSolution, NULL) ; 

29 currentSolution— newSolution; / * Hi newSolution 更 新 currentSolution * / 

30 } 

31 — if(currentSolution->n>1) /* 不 止 一 个 最 短 串 ,排序 * / 

32 listQuickSort(currentSolution, currentSolution->nil->next, currentSolution-> nil) ; 

33 strcpy(r，currentSolution->nil->next->key); 

34 clrList(currentSolution, NULL); 

35 return r; 

36} 


程序 11-3 ”实现 算法 11-5 的 C 函数 
程序 11-3 的 说 明 如 下 。 
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(1) 假定 将 问题 输入 中 一 个 案例 的 数据 (n 个 DNA. 串 ) 存 储 于 一 个 字符 串 数组 dnas 
中 ,其 长 度 为 n。 这 两 者 作为 函数 dna_laborary 的 参数 。 该 函数 将 返回 包含 所 有 nn 个 DNA 
串 的 最 短 字 串 , 故 其 返回 值 为 char * 。 

(2) 由 于 设计 时 不 能 确定 集合 current-solution 和 new-solution 中 串 的 个 数 ,所 以 用 链 
K LinkedList 来 表示 这 两 个 集合 。 第 5 一 30 行 的 for 循环 对 应 算法 11-5 中 的 第 3 一 13 行 的 
for 循环 。 其 中 ,第 9 一 27 行 的 while 循环 对 应 算法 11-5 中 第 6 一 12 行 对 current-solution 
的 扫描 。 第 11 行 调用 程序 11-1 定义 的 函数 shortest_common_str, 完 成 算法 中 第 7 行 的 操 
作 。 第 13 一 24 行 对 应 算法 中 第 8 一 12 行 的 分 支 结构 。 其 中 第 19 一 23 行 的 while 循环 完成 
算法 中 第 12 行 

new-solutions *-new-solutions U result 

的 操作 。 注 意 ,对 每 一 个 链表 ,在 舍弃 之 前 均 需 调用 clrList 释放 存储 空间 。 

(3) 第 31 一 32 行 完成 算法 中 第 13 行 的 操作 ,对 得 到 的 currentSolution 调用 函数 
listQuickSort 排 序 。 程 序 中 所 有 对 链表 的 操作 函数 均 定义 于 2.1.3 节 的 程序 中 。 

为 节省 篇 幅 , 完 成 解决 本 问题 的 主 函 数 在 此 不 予 罗 列 。 连 同 程序 11-1 和 11-2 都 存储 
于 文件 夹 chapl1/DNA Laborary 中 的 源 文 件 DNALaborary. c, 读 者 可 打开 对 照 研读 。 


11.2 最 长 回 文 子 串 问题 


一 个 字符 串 P[1..m]j 称 为 回 文 , 指 的 是 POL mF Gm 为 奇数 ,其 中 心 为 
P[m/2j, 车 m 为 偶数 , 则 其 中 心 为 PLm/2] 与 PLm/2 十 1j] 之 间 的 位 置 ) 对 称 。 例 如 ,ABCBA 
是 一 个 回 文 ,而 ABCAB 就 不 是 回 文 。 我 们 的 目标 是 在 一 个 字符 串 S[1..n] 中 查寻 最 长 的 回 
文子 串 P[1..m]j 二 SLs 十 1..s 十 m]。 这 个 问题 可 以 视 为 非 固定 模式 匹配 问题 。 因 为 相对 于 
固定 模式 匹配 ,虽然 也 是 在 文本 中 查找 一 个 特定 的 子 串 ,但 本 问题 中 的 模式 事先 并 不 知道 其 
构成 字符 和 长 度 。 

如 前 所 述 ,解决 文本 S[1..n] 中 最 长 回 文子 串 问 题 ,需要 对 所 有 2n 十 1 个 可 能 的 中 心 , 考 
察 能 得 到 回 文子 串 , 从 中 选 出 长 度 最 大 者 。 这 2n 十 1 个 中 心 分 别 是 S[1]、S[2]、…、S[n] 
(共有 POA S[1] 之 前 的 位 置 ,S[1]、.S[2] 之 间 的 位 置 `.S[2]、S[3] 之 间 的 位 置 ,…， 
S[n 一 1j、S[Lnj 之 间 的 位 置 和 SL[nj 后 的 位 置 ( 共 有 十 1 个 )。 为 使 对 这 两 类 中 心 所 做 的 操 
作 描 述 的 一 致 性 ,可 以 针对 SL1..n] 构 造 一 个 辅助 串 T[1..2n 十 1], 其 中 TL[1]、TL3]、…、 
T[2n 十 1 填写 一 个 不 属于 字符 集 X 的 字符 , 壁 如 记 为 # 、T[2j]、T[4]、…、T[2n] 分 别 填写 
SL[1]、SL[2j]、…、S[Ln]。 这 一 操作 可 描述 为 以 下 算法 过 程 。 

GET-AUXSTR(S) 

1 n--length[ S] 

2 allocate T[1..2n4-1] and initialized to { 并 ， 并 ，…， 井 } 

3 for i-—-1 to n 

4 do T[2i]-- Si] 

5 return T 


算法 11-6 ”计算 文本 串 S 的 辅助 串 的 算法 过 程 
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例如 , 若 文本 SL[1..4] 二 ABCB, 则 对 应 的 辅助 字 串 T[1..9] - #AFBECHBE, AT 
计算 S 的 最 长 回 文子 串 , 对 12n 十 1 计算 aL]: 工 中 以 工 [为 中 心 最 长 回 文子 串 的 长 
度 之 一 半 。 例 如 ,对 T[1..9] &SASBECEDE ,有 [1..9]={0,1,0,1,0,3,0,1,0}。 在 
计算 出 来 的 数组 x[1..2z 十 1 中 ,假定 最 大 者 为 x[ 眉 一, 若 :一 2 十 1, 则 以 SEI]. SET 1]2- 
间 的 位 置 为 中 心 ,长 度 为 上 的 子 串 必 为 S 中 最 长 的 回 文 。 若 :一 21, 则 S 中 以 S[ 门 为 中 心 ,长 
度 为 的 子 串 为 S 的 最 长 回 文子 串 。 例 如 ,对 于 上 述 S[1..4] 王 ABCB, 对 应 的 T[1..9]— 
划 A#B#C#B# 计 算出 来 的 x[1..9] 中 的 最 大 者 为 x[6] 二 3。 由 于 6 二 2X3, 所 以 S 中 以 
S[3] 为 中 心 的 长 度 为 3 的 子 串 S[2..4]=BCB 为 S 的 最 长 回 文子 串 。 这 样 计算 文 本 串 S 的 
最 长 回 文 子 串 就 转换 成 计算 对 应 的 数组 x[1..2z 十 1] 了 。 


11.2.1 强力 算法 


为 计算 文本 串 S[1.. 站 对 应 的 数组 x[1..2n 十 1], 先 调用 过 程 GET-AUXSTR 构造 出 辅 
助 串 T[1..2n 十 1]。 显 然 ,T[1]==T[2n 十 1]=0。 对 于 每 一 个 1<i<2n +1, M k=1 开始 ， 
以 了 T[ 门 为 中 心 通过 检测 T[i 一 kj 与 T[i 十 kj 是 否 相 等 决定 回 文 扩张 是 否 继续 , 即 & 是 否 自 
增 1, 直 至 T[i 一 kj 隆 T[i 十 kj]。 结 束 扩张 时 , 记 x[ 门 为 一 1。 写 成 如 下 的 伪 代 码 过 程 。 

LANGEST-PALINDROM(S) 

1 TCGET-AUXSTR(S) 

2 n<length(T] 


3 allocate z[1..] and initialized to (0. 0, ++, 0) 


4 for ix-2 ton—1 


5 do k=-1 

6 while i—k>0 and it+k<n and T[i—k]=T[i+k] 
7 do k«k+1 

8 nLi]--4—1 

9 return x 


算法 11-7 ”计算 文本 串 S 的 最 长 回 文子 串 的 强力 算法 


对 算法 11-7 而 言 , 最 坏 情形 发 生 在 S 的 所 有 字符 均 相 等 的 时 候 。 此 时 ,对 每 一 个 
2Ci«n/2. 58 5 一 7 行 的 while 循环 将 重复 i 次。 因此 ,第 7 行 要 执行 1 十 2 十 … 十 (n/2 一 1) 十 
n/2— (n—2)n/Ad-n/2, 式 中 的 (n 一 2)n/4 是 运行 时 间 是 1 十 2 十 … 十 (n/2 一 1) 的 和 。 而 对 
n/2 达 i<n, 根 据 对 称 性 ,第 7 行 的 操作 也 要 执行 1 十 2 十 … 十 (zw/2 一 1) = (n 一 2)n/4 次 ( 见 
图 11-9)。 因 此 ,第 7 行 要 执行 (n 一 2)n/2 十 n/2 二 n(n 一 1)/2 次 。 于 是 LANGEST-PALIN- 
DROM 的 运行 时 间 为 OG. 

图 11-9 展示 了 算法 LANGEST-PALINDROM 运行 于 串 S— AAAA 的 过 程 。 图 11-860 — 
图 11-8(g) 表 示 算 法 第 4 一 8 行 for 循环 的 每 次 重复 。 每 一 部 分 中 i 指示 处 于 当前 中 心 位 置 ， 
双向 弧 数目 表示 内 其 在 第 6 一 7 行 的 while 循环 重复 次 数 ,也 就 是 所 要 计算 的 xil. 
图 11-8(h) 表 示 计 算 所 得 的 数组 x[1..9]。 由 于 串 S 内 的 所 有 字符 都 是 一 样 的 , 故 对 于 每 一 
个 记 以 T[ 站 为 中 心 向 左右 作 扩张 都 能 达到 “极限 ”状态 i 一 k 二 1 Ei en A EE. dal 
表示 出 算法 所 人 遭遇 的 最 坏 情形 。 
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AEF Ta 
#| A[# | A[#[ A[#| A[# 3 [A[e [A] e A[#[A[# #| A|# | A[#| A|# | A[4 
i i 
x pr x [I2 z[4]-3 
(a) (b) (c) 
—A kk b 4 À kA A—k P ae kF at 
* | A[* [A[*[A| *] Al # *[A[*[A[*[A[* [A] # #] al #]al#[ala[al# 
i i i 
x [5]=4 x [6]=3 x[7]=2 
(d) (e) (f) 
| a à 
#| A|#| A|#| Al e] Al # o[1[2]s[4[s|2[1]o 
i 
2 [8]-1 2 [1.9] 
(g) (h) 


图 11-9 对 S=AAAA 3247 LANGEST-PALINDROM(S) ff] t f 


此 例 还 展示 出 回 文 串 的 一 个 诱 人 特性 ,注意 以 T[L5] 为 中 心 的 回 文子 串 最 长 , 它 涵盖 
整个 工 。 也 就 是 说 工本 身 是 一 个 回 文 串 , 根 据 回 文 串 的 对 称 性 ,包含 在 工 内 部 的 回 文子 串 
关于 T[5j 是 对 称 的 。 这 一 事实 反映 在 数组 x 上 ,元素 的 值 关 于 x[5] 是 对 称 的 。 换 句 话说 
如 果 事 先知 道 TL5] 为 中 心 的 回 文子 串 涵 盖 了 整个 工 , 则 对 esi9. dd iyi XT 5 的 对 称 
位 置 , 则 必 有 [l= x[i 站 ,无 须 再 以 T[ 站 为 中 心 进行 “扩张 了。 在 11. 2. 2 节 中 ,会 看 到 这 
一 特性 是 改善 计算 最 长 回 文子 串 的 关键 。 


11.2.2 Manacher 算法 


根据 上 文 的 对 一 个 特例 的 讨论 ,已 知 可 以 利用 回 文 关于 中 心 对 称 的 特性 改善 算法 的 运 
行 时 间 效 率 。 现 在 对 一 般 的 情形 进行 形式 化 的 表述 。 对 于 任 一 文本 串 SCIL n] Ho8 mr i9 
助 串 设 为 T[1..2n 十 1]。 如 前 所 述 , 有 x[1]—x[2nc-1]—0. mF x[2] 对 应 的 是 以 T[2] 为 
中 心 的 最 长 回 文子 串 区 间 半 径 ,而 T[2] 左 边 仅 有 一 个 特殊 字符 # ,而 右边 也 有 一 个 #, 故 
x[2] 王 1。 对 于 2<i<2n +1, WE x[1..i 一 1 已 经 算得 ,我 们 来 计算 ali], RN na xr 
O<k<i, TLk— n[&].. 十 x[LA]] 是 工 中 以 & ARKH HH, k— rlik] E alk 4 
别 是 该 回 文子 串 的 左 、 右 边界 。 选 取 右 边界 最 大 的 那个 回 文子 串 , 记 其 中 心 为 C, 右 边界 
R=C 十 x[Cj, 左 边界 L== C 一 x[Cj, 则 TLL..R]J& T PAC 为 中 心 的 最 长 回 文子 串 ( 见 
图 11-10)。 


L C R 


, i—mÀÓ 000 


图 11-10 工 中 以 C 为 中 心 ,左右 边界 分 别 为 工 `R 的 回 文子 串 


利用 TLL..R] 关 于 C 的 对 称 性 ,我 们 有 如 下 观察 。 
OD #i<R.B TET. T[L..R] 内 。 令 i 为 i 关于 C HMA. DA L<i’<C(<i), 
当然 D EOM. Hd xD Tg M.A TL 一 x[i J].. 十 x[i"]] 是 以 为 中 心 的 最 长 回 
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XT. 
@ 车 i 一 x[i] SL AeA i4 xL ISR). TD? — aLi]... i Hali 118 T TLL..R] 
内 。 根 据 TLL..R EDS EE. TDi xD ].. i 十 x[i]] 也 包含 在 TOL..RIA. EW i Jg pop 
的 回 文子 串 ( 未 必 最 大 ) «BEDA x iA xD ] 开 始 取 值 ( 见 图 11-1D 。 
R 
x fi’) | EE 


[i i 
图 11-11 当前 扩张 中 心 TU]AROEXT TLC] 的 对 称 点 TU TET. T[L..R] 内 且 以 TU? 98 
中 心 的 最 长 回 文子 串 含 于 TLL..R] 内 


© Biali] 过 L( 因 此 也 有 i 一 x[i] 之 R) 我 们 只 能 保证 T[L.. 2/ —L]& T TLL..R] 
内 且 为 回 文子 串 ( 未 必 最 大 ) 而 其 在 T[LL..R] 中 关于 C 对 称 的 T[2i 一 R..Rj 是 以 i 为 中 心 的 
回 文 。 因 此 ,x[ 站 应 该 从 R 一 i 起 取 值 ( 见 图 11-12) 。 
L C R 


nq - and 
T 


i i 
图 11-12 当前 扩张 中 心 T[ 让 及 其 关于 TLC] 的 对 称 点 TOF T[L..R] 内 ,但 以 
T[i"] 为 中 心 的 最 长 回 文子 串 的 左边 界 位 于 TLL] 的 左边 


也 就 是 说 ,在 i=R 的 条 件 下 , “扩张 "的 起 点 应 该 是 x[i]— min{x[i], R— i). 
k 二 x[ 让 十 1, 依 次 检测 T[i 一 kj 是 否 等 于 TE 十 Jj 而 决定 x[ 门 的 增 量 。 

(2) #iSRW TUMEF T[L..RJ 中 心 的 右边 ,此 时 ,T[L..RJ 的 对 称 性 对 以 i 为 中 心 
的 回 文 长 度 的 确定 不 能 提供 任何 有 用 的 信息 (自然 ,x[0..i 一 1] 也 都 是 如 此 )。 所 以 ,x[ 门 
只 能 从 0 起 ,k 从 1 起 ,依次 检测 T[i 一 kj 是 否 等 于 T[i 十 kj(k 二 1,，2,…) 而 决定 [i] 
增 量 。 

对 当前 中 心 位 置 的 “扩张 ?结束 时 A itali >R WK C 更 新 为 i, 而 R 自然 就 要 更 新 
Wit+nlil(L 自然 为 i 一 x[ 门 ) ,为 计算 下 一 个 i 做 好 准备 。 

MANACHER(S) 

1 T+-GET-AUXSTR(S) 

2 n--length[ T] 

3 n[1]-7x[2]--0. n[2]-71 

4 C—2,R—i-—3.k--n[i]--1 


5 while ¿<n 

6 do if TLi—k]=TLitk] 这 还 在 “扩张 ”中 

ri then z[i]-7z[i]--1 

8 k-—kl 

9 else if ic- a[i] RD “扩张 "结束 且 需 要 调整 新 的 C、R 

10 then C<i 

ii Rei+ax[i] 

12 i<i 十 1,i'<-2C 一 i 户 开始 新 的 中 心 位置 并 计算 其 关于 C 的 对 称 位 置 
13 if i<RD tH 1 
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14 then z[;]-7min( R— i. x[i ]) 
15 else x[ i]--0 D HIE 2 

16 keali}+1 

17 return x 


算法 11-8 ”线性 时 间 的 计算 最 长 回 文子 串 算法 
图 11-12 展示 了 算法 11-8 运行 于 文本 串 SC BABCBABCBACC 的 过 程 。 


LCR 
B|#|A|#|B|#|C|#|B|#| Al # #| B) #| Aj #| B) #) Cl) # Cl #| B|#| A| 4 |C| 
o] PPR 0 
i 
(a) (b) 
L L c R 
* *[B[* [A[* BI #] C[4 TBI TA[S ST CB COCULOCOCORODOCE 
0 I 0 o[1[o[sTo[t 0 
it i i i 
(d) 
L L c R 
D] v[c[*]B[|*[A[|s[c[|»v] [*|]B||A[s|B[s[c[ €] B| | A| e| B| * DERECE 
0 o] PL no 0 
r i 
(0 
L R L C R 
* *[c[*[B[*TA[*[c[* DUE 77087 C ATCT ATCT 
0 I [o o[1[o[s[o[1|o[7]o[i I 0 


(m) (n) 
图 11-13 算法 11-6 运行 于 文本 串 S=BABCBABCBACC 的 过 程 


545 


从 算法 到 程序 (第 2 NO 


L € R L C R 
at 
#| Bi #| Al #| BN C| 4£ | BL. 4| AL #| BI $] CIE] BI#| AL &| C| € *[B[* [ ATSTB[S] Cl #| 8| 4 [ A[ *| B] | CRTBIS] A[4[C| 
o[1[o[s[o[1[o[7]o[1]o[9o[1[o[s[o 0] [erifo[sTo[1To[7]o[1]o[9[o[ 1] o[s[o]1 I 0 
i i i i 
(0) (p) 
L Cc R L c 


i i i i 
(q) (r) 
L [^ R L [^ R 
B a 
#|B|#| Al #|B|#|C|#|B|#|A|#|B|#|C|#|B|#|A|#|Cc|# #|B|#|A|#|B|#|C|#|B|#|A|#|B|#|C|#|B|#|A|#|C|# 
0|1/|0]3/|0|1/0|7/|0|1/|0/|9|0/1[0/|5|0|1|0|1|0 0 0/|1/0/|3/0/|1/|0/|7|0/|1|0/9/0/1/0|5|0/1/|0|1|0/|1|0 
i i 
(s) (0 
图 11-13 ( 续 ) 


图 11-13(a) 初 始 时 ,C=2, 由 于 x[C]==x[2]=1, 故 R=C 十 x[C]==3, 相 应 地 ,R 关于 
C 的 对 称 位 置 荆 为 1。 要 计算 的 是 ;一 3 处 的 x[ 门 ,由 于 i 二 3=R, 属 于 上 述 的 情形 2, 所 以 
x[ 站 初始 化 为 0,k 初始 化 为 x[ 让 十 1 王 1。 由 于 TLi—kJ=TL2J=BAA=TH4J=TLit+k] 
(图 中 用 带 X 的 双向 弧 线 表示 ) ,于 是 x[ 问 保持 为 0, 本 轮 “ 扩 张 ?结束 。 由 于 ;十 x[ 门 一 3 一 R， 
故 CL、R 保持 不 变 。 

图 11-13(b) 中 ,上 一 轮 * 扩 张 ”结束 后 ,i 自 增 i HARKER, RIIE 2, 于 是 xL] 
0 开始 ,& 从 x[ 门 十 1 二 1 起 进行 扩张 ,扩张 直至 超出 文本 左边 界 为 止 。 每 次 扩张 LER 
1, 累 计 为 3。 由 于 i 十 x[ 门 =4 十 3 二 7 之 R, 调 整 C 为 i=4,R= i+nli]=7,L 5R XT C9 
称 ,自然 就 应 该 为 1。 

图 11-13(c) 中 ,本 轮 的 扩展 中 心 i=5 二 7 二 R, 属 情形 1。i 关于 C 的 对 称 点 i =, 
z[i/1—0.7 —z[i ] 2 321—L li xLi EI 4628 nli] PRM &— nli] +1=1 开始 ,但 是 一 
开始 便 遭 遇 了 失败 ,扩张 复 然 停止 。 于 是 x[ 站 保持 为 0。i 十 x*[ 门 二 5 达 7 二 R, 故 CL、R 保 
持 不 变 。 

图 11-13(d) 中 ,i 来 到 6 二 R, 仍 属 情形 1. 关于 C 的 对 称 点 i 二 2, 与 图 11-13(c) 中 一 
Rei! — nli JH 1S 1 = Le xLi EP t8 4679 Li PKA R= ali] +1=2 开始 。 扩 张 的 结果 
是 xliJ=1. AIR 11-13(c) 中 一 样 ,CL、R 保持 不 变 。 

图 11-13(e) 中 ,i E 1828 7—R. MA 11-13(a) 中 一 样 , 属 情形 2。 同 样 的 以 i 为 中 
心 的 扩张 结果 为 x[i]—0. HF id xDi]—R. ik C. L,R EX. 

图 11-13(f) 中 ,本 轮 扩张 中 心 位 于 i 二 8 记 R, 属 情形 2. x[i]—0 开始 扩张 。 与 
图 11-13(b) 类 似 ,本 轮 扩 张 的 结果 x[ 妆 ==7。 由 于 i 十 x[ 门 =15 > R, 故 CLR 分 别 调整 为 
851,15, 

图 11-13(g) 一 图 11-13(j) 分 别 表示 在 CL AMR 41979 8.1.15 时 ,扩张 中 心 ;一 9、10、 
11,12 的 “扩张 操作。 由 于 i 取 这 些 值 时 均 有 i<R, 故 都 属于 情形 1。 和 图 11-13(c) 一 样 ， 
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这 些 i 值 对 应 的 关于 C 的 对 称 点 i 及 其 Li EB i a Li SL UT TK BEI 
z[i]— xL ] k= x Li ]--1 开始 检测 T[i 一 kJ 与 T[i 十 kJ] 是否 相等 。 图 11-13(j) 操 作 完毕 时 ， 
ix[i]-212715—R. TA.C.L MR 分 别 调整 为 12.3 和 21。 

与 图 11-13(g) 一 图 11-13Gj) 相 仿 , 图 11-13(k) 一 图 11-13(Cr) 在 C 工 和 尺 保持 不 变 ( 分 
别 为 12、3、21) 的 情形 下 ,扩张 中 心 为 i 二 13、14、…、20( 均 小 于 RR) 时 的 扩张 操作 。 虽 然 均 属 
于 情形 1, 但 在 图 11-13(k)、 图 11-13(])、 图 11-13(m)、 图 11-13(0)、 图 11-13(p)、 图 11-13(i) 
和 图 11-13(q) 中 ,i 关于 C 的 对 称 点 ,对 应 的 之 一 rz] 均 不 小 于 工 , 所 以 扩张 起 点 x[ 门 为 
xl’). MOA) P i —2 0 VF L BEA GE eli] R— i. K 11-13(r) 扩 张 完成 
时 x[i]—1.i4-x[i]—21—R fk CL MR 保持 不 变 。 

图 11-13(s) 和 图 11-13(t) 中 ,i=21 和 ;一 22 WSR JE 2, 扩 张 起 点 [让 =0, 扩 
张 结果 x[ 门 分 别 0 和 1。 

算法 11-6 的 运行 时 间 取 决 于 第 5 一 15 行 的 while 循环 的 重复 次 数 。 该 循环 的 重复 条 
件 是 i<n, 循 环 体 是 一 个 二 分 支 结 构 。 分 支 之 一 的 第 9 一 15 中 执行 i<-i 十 1 的 自 增 操作 ,所 
以 这 一 分 支 必 执 行 OG). FH 7 一 8 行 构 成 的 另 一 个 分 支 是 以 当前 的 i 为 中 心 ,进行 回 文 扩 
张 。 由 于 当前 扩张 过 程 中 比较 T[i 一 杂 和 T[i 十 J] 相等 的 次 数 记录 在 x[ 门 ,成 为 后 来 与 i 关 
PHEA C 对称 点 的 扩张 起 点 ,所 以 比较 T[i 一 条 和 T[i 十 J 相等 的 次 数 也 是 OG). 


11.2.3 程序 实现 


C 语言 没有 向 程序 员 提供 计算 字符 串 中 最 大 回 文子 串 的 库 函 数 。 这 里 来 实现 线性 运行 
时 间 的 MANACHER 算法 。 首 先 ,需要 实现 算法 11-6 中 计算 辅助 字 串 的 GET-AUXSTR 
过 程 。 


1 static char * getAuxStr(char * s) { 
int n= (int) strlen(s) ; 
if (n— —0) return NULL; 
char * t= (char * )calloc(2 * n+2, sizeof(char) ) ; 
memset(t,' #', 2* n+1); 
for (int i=0; i <n; i++) 
t[2 * i+1]= Li]; 
return t; 


OI Oo c £ ot 


程序 11-4 ”实现 算法 11-6 的 C 函数 


函数 getAuxStr 计算 由 参数 s 传递 给 它 的 字符 串 的 辅助 字 串 1 ,并 作为 函数 值 返 回 。 程 
序 代码 与 算法 的 伪 代 码 结构 上 几乎 是 一 致 的 。 需 要 注意 的 细节 如 下 。 

CL) 车 ;是 空 串 , 辅 助 串 当然 亦 为 空 。 

(2) 第 4 行为 辅助 串 上 分 配 空间 为 2n--2 个 字符 ,而 非 2n 十 1 个 字符 。 这 是 因为 C 语 
言 的 字符 串 式 存储 在 字符 数组 中 以 \0 为 结束 标志 的 字符 序列 。 因 此 ,需要 为 \0 预 留存 储 空 
间 。 由 于 我 们 使 用 calloc 函数 为 :分 配 空间 ,该 函数 在 分 配 空 间 后 将 所 有 字 节 初始 化 为 0， 
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所 以 第 5 行 调 用 库 函 数 memset H # 3E £L0..2n ] 4[2 *n +1] A RRR A\O. 

(3) getAuxStr 仅仅 在 以 下 实现 算法 11-8 的 函数 中 被 调用 ,并 不 需要 (也 不 希望 ) 其 他 
代码 无 意 中 调用 它 而 造成 混乱 ,所 以 将 其 定义 为 static 函数 ,这 样 就 将 其 可 见 范围 限制 在 本 
文件 中 了 。 

利用 程序 11-4, 可 以 将 算法 11-8 实现 如 下 。 


lint * manacher(char * s){ 


2 char * t—getAuxStr(s) ; 

3 size t n=strlen(t) ; 

4 int * pi= (int * )calloc(n, sizeof(int)) ; 

5  intc-l. r=2, i=2, k=1; 

6 pi[1]=1; 

7 while (i<n— 1) ( 

8 if Ci - kn& &da[i— k]— — [i kp ( // 以 i 为 中 心 ,扩展 
9 piLi]d- 0; 

10 k++; 

11 continue; 

12 ) 

13 if (i+pili]>r) ( // 调 整 参 照 回 文子 串 
14 c=i; 

15 r=i+ pii]; 

16 } 

17 it: // 下 一 个 扩展 中 心 i 
18 int 这 一 2 * c—i; /Vi 关于 参照 回 文子 串 中 心 “ 对 称 位 置 
19 if (i) Wi 在 参照 回 文子 串 内 部 
20 pi[i]— minGr—i, pi[i1]); //pi[ 训 的 初始 值 

21 k— pi[i]--1; // 扩 展 的 起 点 

22 } 


23  free(0; 
24 return pi; 


程序 11-5 ”实现 算法 11-8 的 C 函数 


程序 11-5 的 代码 结构 与 算法 11-8 的 伪 代 码 结构 也 是 高 度 一 致 的 。 需 要 注意 的 是 第 
20 行 调用 的 计算 r 一 i 和 pi[il] 的 较 小 值 的 函数 ,代码 如 下 。 
int minCint a, int b)( 


return ab? a:b; 


} 


此 外 ,由 于 用 calloc 函数 为 pi 分 配 的 空间 ,所 以 pi[0..n 一 1] 均 初始 化 为 0。 这 样 ,对 发 
生 情形 2( 即 iD) 时 无 须 将 pi[i] 重 置 为 0。 程序 11-4 和 程序 11-5 的 代码 均 存 储 在 文件 夹 
utility 中 的 源 文件 textmatch.c 中 。 
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11.2.4 应 用 


Palindrome 


The“U. S. Robots" HQ has just received a rather alarming anonymous letter. It 
states that the agent from the competing (Robots Unlimited) has infiltrated into “U. S. 
Robotics". (U. S. Robots) security service would have already started an undercover oper- 
ation to establish the agent's identity. but. fortunately. the letter describes communica- 
tion channel the agent uses. He will publish articles containing stolen data to the "Solaris" 
almanac. Obviously, he will obfuscate the data. so “Robots Unlimited" will have to use a 
special descrambler (“Robots Unlimited" part number NPRx8086. specifications are kept 
secret), 

Having read the letter, the “U. S. Robots" president recalled having hired the “Ro- 
bots Unlimited" ex-employee John Pupkin. President knows he can trust John. because 
John is still angry at being mistreated by “Robots Unlimited". Unfortunately. he was 
fired just before his team has finished work on the NPRx8086 design. 

So. the president has assigned the task of agent's message interception to John. At 
first. John felt rather embarrassed. because revealing the hidden message isn't any easier 
than finding a needle in a haystack. However. after he struggled the problem for a while, 
he remembered that the design of NPRx8086 was still incomplete. "Robots Unlimited" 
fired John when he was working on a specific module. the text direction detector. Nobody 
else could finish that module. so the descrambler will choose the text scanning direction at 
random. To ensure the correct descrambling of the message by NPRx8086, agent must en- 
code the information in such a way that the resulting secret message reads the same both 
forwards and backwards. 

In addition. it is reasonable to assume that the agent will be sending a very long mes- 
sage. so John has simply to find the longest message satisfying the mentioned property. 

Your task is to help John Pupkin by writing a program to find the secret message in 
the text of a given article. As NPRx8086 ignores white spaces and punctuation marks. 
John will remove them from the text before feeding it into the program. 

Input 

The input consists of a single line. which contains a string of Latin alphabet letters 
(no other characters will appear in the string). String length will not exceed 1000 charac- 
ters. 

Output 

The longest substring with mentioned property. If there are several such strings you 


should output the first of them. 
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Sample 


Input output 


ThesampletextthatcouldbereadedthesameinbothordersArozaupalanalapuazorA ArozaupalanalapuazorA 


这 是 一 个 很 直接 的 题目 ,就 是 计算 输入 的 字符 串 s[0..n 一 1] 的 第 一 个 (可 能 有 多 个 ) 最 
长 回 文子 串 ,并 输出 。 调 用 程序 11-5 的 manacher 函数 ,返回 的 是 关于 s 的 辅助 字 串 t[0..2n 
十 1] 中 每 个 字符 为 中 心 的 最 长 回 文子 串 长 度 的 一 半 构 成 的 数组 pi[0..2n 十 1]。 用 下 列 函 数 
找 出 第 一 个 最 大 值 元 素 下 标 。 
int maxele(int * a, int n){ 
int m—0; 
for(int i=1; in; i++) 
if(ali]>alm]) 
return m; 


) 


设 调用 maxele (pi) 3R FIA i. pili] f fL 29 length, T JE. s[i/2 — length/2..i/2 + 
length/2 一 1] 就 是 所 求 。 写 成 代码 如 下 。 


char * longestPalindromeString(char * s)( 
int n—strlen(s), * pi=manacher(t), i, length; 
char * s1— (char * )calloc(n, sizeof(char)) ; 
n=2* n+l; 
i= maxele(pi, n); 
length= pii]: 
memcpy(sl, st+i/2—length/2, length); 
/ * Y s[i/2 一 length/2..i/2 十 length/2 一 1] 复 制 到 s1[0..length—1] * / 
freeCpD ; 
return sl; 


} 
完整 的 程序 代码 存储 于 chapl1/Palindrome 的 源 文件 palindrome. c, 读 者 可 打开 研读 。 


11.3 近似 匹配 


在 信息 处 理应 用 中 ,往往 需要 进行 文本 的 近似 匹配 。 例 如 ,要 在 一 段 文本 工 中 查找 一 
个 单词 的, 但 并 不 能 完全 确定 W 的 正确 拼写 。 在 这 种 情况 下 ,我 们 要 求 在 了 中 查找 与 W 
最 相近 的 单词 。 

11.3.1 最 小 编辑 距离 


首先 ,需要 定义 工 中 与 W 相近 的 单词 的 意义 。 为 此 ,我 们 要 明确 将 一 个 词 PES” 换 成 
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另 一 个 词 WED -允许 做 的 所 有 操作 。 这 些 操作 包括 如 下 。 

(1) 用 一 个 字符 替代 另 一 个 字符 。 

(2) 删除 一 个 字符 

(3) 插入 一 个 字符 

WP. WEI. 将 P 变换 成 W 过 程 中 ,所 做 的 上 述 合法 操作 的 次 数 定义 为 P 和 W 的 
编辑 距离 , 记 为 dist(P, W)。 显 然 , 对 两 个 给 定 的 P, WES 而 言 ,用 合法 操作 将 P 变换 成 
W 的 方式 并 非 唯一 。 例 如 ,假定 P= 二 ghost,W 二 house, 可 以 按 下 列 步 又 变换 。 


(D ghost ”删除 第 一 个 字符 gc host 
( host 在 第 二 、 三 个 字符 之 间 插 和 人 字符 u> houst 
(3) houst 将 最 后 字符 t 蔡 换 成 ~e house 


在 此 方案 中 ,dist(P, W)=3. 

也 可 以 将 P 中 的 所 有 字符 都 人 删除 (进行 了 length[P] 次 操作 ) ,然后 逐一 添加 W 中 的 各 字 
符 ( 进 行 length[W] 次 操作 ) 完 成 替换 。 这 样 ,dist(P, W) =length P]+length[W]=10, 

由 此 可 见 ,要 将 给 定 的 字符 串 已 ,用 合法 操作 变换 成 指定 字符 串 W ,存在 多 个 可 能 的 解 
决 方案 ,每 个 方案 都 有 一 个 编辑 距离 。 也 就 是 说 , 按 上 述 定义 的 编辑 距离 不 是 唯一 的 。 我 们 
的 目标 是 找 出 编辑 距离 最 小 者 作为 唯一 值 。 显 然 ,这 是 个 组 合 优化 问题 ( 见 本 书 7.4.1 节 )。 
可 以 利用 第 8 章 引 入 的 “动态 规划 ”策略 解决 这 个 问题 。 为 此 ,我 们 考察 本 问题 如 下 的 最 优 
子 结构 。 

i P-—P[1.5],W—W[1..n]€ X' . E P ffi PL1../].4—0. 1, n MW 的 前 
E WL1..;].j—0. 01. =, m 的 最 小 编辑 距离 。 当 i 二 0 HELP 1.2] 76 (€ E * ),P[1.. 右 转换 
成 允 [1.. 门 只 有 一 种 方案 , 那 就 是 在 P( 从 空 串 s 开 始 ) 中 逐一 插入 W[1.. 门 的 每 个 字符 ,所 
以 ,编辑 距离 (也 是 最 小 编辑 距离 为 力 。 同 样 ,对 于 7 一 0, 克 [1..7 门 =s。PF[L1.. 革 转换 成 
W[1.. 站 也 只 有 一 种 方案 : 在 已 中 逐一 删除 每 一 个 字符 ,其 最 小 编辑 距离 为 ?7。 对 于 i0 和 
j770 的 情况 ,可 以 用 下 列 3 种 方式 之 一 将 PULL HERO W 1.7]. 

CD 删 掉 PL] K P[1..i 一 1 转换 成 W[1..7]。 

(2) 在 PLL. ridi A WOU] PL1.. 疏 转换 成 W[1..j 一 1]。 

(3) PLi]2 WLj]- HRH P[1..i 一 1] 转 换 成 W[1..j 一 ,否则 先 将 PLi Hox WEG] 34 
将 P[1..i 一 1] 转 换 成 W[1..j 一 1]。 

THE d; 表示 P[1.. 门 转换 成 W[1.. 门 的 最 佳 方案 所 执行 的 合法 操作 次 数 , 则 根据 以 上 分 
析 , 有 如 下 的 递归 方程 : 


i j=0 
j i=0 
dj = 1min(dzaja day +1sdy1 +1} i20,20.P[i] = WL] (1-3) 


min(draja -ledzaj -ldga +1} i>0.j>0.PLI E WLj] 
m 


BORE ,就 可 以 构建 一 个 自 底 向 上 的 记 表 计算 de 的 算法 。 


OPTIMAL-EDIT-DISTANCE(P, W) 
1 n<length[P], m<lengthlW] 
2 allocate d[0..n, 0..m] 
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3 for j<-0 to m 

4 do d[0, j]—j 

5 for i<-1 to n 

6 do d[i, 0]—i 

7 for i—-1 ton 

8 do for j4-1 to m 


9 do a--min(d[i—1. j]+1, d[i, j—1]+1} 
10 if PL] -WLj1 

11 then 5—4[i—1, j—1] 

12 else b<-d[i—1, j—1]+1 

13 dli, j]<min{a, 5) 


13 return d[n, m] 
算法 11-9 计算 字符 串 PW 最 小 编辑 距离 的 算法 


很 容易 看 出 来 ,算法 11-9 的 运行 时 间 主 要 耗费 在 第 7 一 11 行 的 两 重 循环 上 ,这 两 个 帜 
套 的 循环 都 是 计数 循环 ,外 层 重 复 次 ,里 层 重复 次。 循环 体 (第 9 一 13 行 ) 内 的 操作 都 
是 常数 时 间 的 ,因此 ,该 算法 的 运行 时 间 为 6(mn)。 下 文中 以 dist CP WO os PW 的 最 小 
编辑 距离 。 


11.3.2 最 佳 近似 匹配 


现在 来 描述 文本 的 最 佳 近似 匹配 问题 。 

输入 : SAH T[1..n] € X! ,模式 串 P[1..m]E€3* 。 其 中 ,mn。 

输出 : 字符 串 W[1.. 相 ,整数 1<i<j 二 n, 使 得 j 一 i 十 1=1,W[1..1]=TL[i..jj] 且 
dist(P, W) 最 小 。 

解决 此 问题 的 强力 算法 ,是 对 所 有 的 偏 移 量 0 三 ;二 n, 和 所 有 可 能 的 长 度 1 志 / 志 nn 一 RI 
用 OPTIMAL-EDIT-DISTANCE 过 程 ,计算 dist(P[1..mj,T[s 十 1..s 十 由 ) ,跟踪 最 小 者 对 
应 的 偏 移 量 index 和 长 度 length。 伪 代码 过 程 描 述 如 下 。 


NAIVE-APPROXIMATE-MATCHER(T, P) 
ln<-length[T], m--length[ P] 

2 mir distance*-o^ 

3 for 5-0 to n—1 

4 do for /<-1 to n—s 

5 do d<-OPTIMAL-EDIT-DISTANCE(P, T[s+1..s+/]) 
6 if d — mir-distance 

ri then min-distance<-d 

8 index-—s 

9 length-—l 

10 return index and length 


算法 11-10 在 文本 T 中 查找 模式 已 的 最 佳 近似 匹配 的 强力 算法 
算法 11-10 的 第 3 一 9 行 的 两 重 循环 的 循环 体 (第 5 一 9 行 ) 共 重复 OG"). EK HE ,第 
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5 行 调用 OPTIMAL-EDIT-DISTANCE 过 程 计 算 dist(P[1..m],T[s 十 1..s 十 1]), 耗 时 
Onm)。 故 总 的 运行 时 间 为 OCzzzz ) 。 

其 实 , 这 也 是 个 组 合 优 化 问题 。 考 虑 模式 的 前 级 PLI. 2] 3 SCA B 3E TL1.. 门 的 所 有 后 
级 T[..j] 二! 说 的 编辑 距离 的 最 小 者 。 对 于 i 二 0,P[1.. 杂 =e(E€ E ) ,我 们 认为 P[1.. 门 
与 TU1.. JPM e 的 编辑 距离 为 0, 是 最 小 的 。 对 于 j 二 0,T[1.. 门 二 e(E5x), 必 须 删 
掉 P[1.. 疏 所 有 字符 才能 与 之 匹配 。 而 对 于 ;过 0 A j 这 0, 和 计算 两 个 字符 串 的 编辑 距离 相 
仿 ,可 以 用 以 下 3 种 方式 之 一 ,得 到 P[1.. 门 与 T[1.. 门 的 所 有 后 级 TLL..j ) OSIS) Sp E 
离 的 最 小 者 。 

CD 删 掉 PLI] iT P[1..i 一 1] 与 T[1.. 门 的 所 有 后 级 的 编辑 距离 的 最 小 者 。 

(2) 在 POLi ath A T[ 站 ,计算 P[1.. 疏 与 T[1..j 一 1] 的 所 有 后 缀 的 编辑 距离 的 最 
小 者 。 

(3) # P[ 让 二 W[ 站 ,直接 计算 PL[1..i 一 1] 与 T[1..; 一 1] 的 所 有 后 缀 的 编辑 距离 最 小 
者 ,否则 先 将 PLD me T[ 门 ,再 计算 P[1..i 一 1] 与 T[1..j 一 1] 的 所 有 后 级 的 编辑 距离 最 
小 者 。 

W P[1..i 一 1] 与 T[1.. 站 的 所 有 后 级 的 的 最 小 编辑 距离 值 为 ady ,上 述 分 析 可 表示 为 如 
下 递归 方程 : 


0 i=0 
d i EM (11-4) 
li 77 | mintad aja sad a; +1,ad 41 +1) i>0.j PL] = TG] 


minlad aja +1sadi4; +1eadjy1tl}) i>0.j >0.PL]ATY] 
Ait OT PAI TSE TN HE POL. TUI. TA TU.. j] OS) 
的 最 小 编辑 距离 cdw j=l, 2. n no 


APPROXIMATE-MATCHER(P, T) 
1 m<length(P], n<-length[ T] 

2 allocate ad [0..m, 0..n] 

3 for j—0 to n 

4 do d[0. j]--0 

5 for i--1 to m 

6 do d[i, 0J<i 

7 for i«-1 to m 

8 do for j--1 to 


9 do a<min{ad[i—1, j]+1, ad[i, j-1]1) 
10 if PLi]- TLj] 

11 then b<-ad[i—1, j—1] 

12 else 5--ad[i—1, j—1]+1 

13 ad[i, j ]*-min(a, b} 

13 return ad 


算法 11-11 计算 文本 T PRR P 的 近似 匹配 的 动态 规划 算 


算法 11-11 在 Onm BET] CS 7 一 13 行 两 重 循环 的 重复 次 数 ) 内 按 式 (11-4) 计 算出 数 
K ad[0..m. 0..n].. YE adm ado 、…、acdmw 中 找 出 最 小 者 ad ,就 得 到 了 P 在 工 中 的 最 佳 
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近似 匹配 的 最 后 一 个 字符 的 下 标 :。 可 以 用 下 列 的 过 程 得 到 最 佳 近似 匹配 TLL.(]. 
SOLUTION(T, ad, i, j) 
1 if i=0 
2 then return 
3 if ad[i. j]—adLi—1. j—1] or adi. j]—ad(i—1. j—1]+1 
4 then SOLUTION(T, ad, i—1. 7 一 1) 
5 print T[j] 
6  eleifad[i, j]—ad[i, j—1]+1 
7 then SOLUTION(T, ad, i, j—1) 
9 print TLj] 
10 else SOLUTION(T, ad, i—1, j) 


算法 11-12 根据 APPROXIMATE-MATCHER(P, T) 算 得 的 数 表 ad 计算 最 佳 匹配 的 算法 


算法 11-12 是 一 个 递归 过 程 ,顶层 调用 应 该 是 SOLUTION(T, ad, m, 1)。 其 中 的 第 
1 一 2 行 是 递归 头 ,表示 递归 结束 的 条 件 。 第 3 一 10 fric f ip AS ERR ad[i, 门 的 取 值 ， 
决定 文本 T 中 构成 模式 尸 的 最 佳 近似 匹配 的 字符 ( 见 图 11-14) 。 

图 11-14 展示 了 对 T = "james. peirce, dewey”, P = pierce 运行 APPROXIMATE- 
MATCHER(P, 了 T) 后 所 得 表格 ad ,运行 算法 SOLUTION(CT,ad ,mo 的 过 程 。 在 此 例 中 ， 
APPROXIMATE-MATCHER 算得 的 数 表 ad 中 最 后 一 行 ad[6, 1..18] 的 最 小 值 cd[m， t] 
为 ad[6, 12] (对 应 的 格子 带 有 浅 色 阴影 ) ,于 是 ,调用 SOLUTION(CT, ad, 6, 12)。 由 于 
ad[6, 12]—2-— ad[5. 11]( 浅 色 阴 影 格 子 ) , 故 递 归 调 用 SOLUTION(T ad, 5. 11)。 由 
于 ad[5, 11]—2- ad[4. 10] ( 浅 色 阴影 格子 ) ,递归 调用 SOLUTION(T, ad, 4, 10), fH 
T ad[4, 10]—2-—ad[3. 9] 十 1( 浅 色 阴 影 格 子 ) ,递归 调用 SOLUTION(T, ad, 3, 9)。 同 
FÉ ad[3. 9] 王 2 一 ad[2，8] 十 1( 浅 色 阴 影 格 子 ) ,递归 调用 SOLUTION(T ad, 2, 8)。 而 
ad[2, 8]—1- ad[1, 7] 十 1( 浅 色 阴 影 格 子 ) ,递归 调用 SOLUTION(T, ad, 1, 7)。 最 后 ， 
ad[1, 7]—0-ad[0. 6]( 深 色 阴 影 格 子 ) ,到 达 递 归 头 (i 二 0)。 逐 级 返回 前 打印 对 应 的 T[ 站 ] 
得 到 P — pierce 在 中 的 最 佳 近似 匹配 为 T[6..12]==peirce。 


0 12 3 4 5 6 7 8 9 10 11 12 13 1 15 16 17 18 

j 4 qm e s. p € i f o €, d e w e y 

0 0|0[|0|0/|0/0 [e] 0|0|0101010101010101010 
E | Db pl 1|1[|1| 2 E 1| 1 1 1 1 1 1 1 1 1 1 
2 i 2|2|]2|2]|2|2]|2|1 ||] 13:12:12: [| 2-|:22:]1:2: | 3 RIEA E 
3 e|3[/3/3|3|/2/3/3]|2 |1 $E 2|3|2|3|3]|2]|3]|2]|3 
4 r14|[4|4[|4[|[3]|3/|4/[|3/]|2[|2[|[2/]|3|3/|3/|4[|3[|3/]|3]|3 
5.6|5/;51|51[5|4|4|41|4/|3|3|3|2|3|4,4|4|4]|4|4 
6 e|(6[|6|61|6|5/|5|5|5|4|4|4|3|2]|3|4|4|5]|4|5 


11-14 ”运行 算法 SOLUTION(T, ad. m, Oft 


由 于 调用 输出 最 佳 匹配 的 运行 时 间 取 决 于 递归 次 数 ,而 每 次 递归 i、j 至 少 有 一 个 自 
I 1, 故 递归 次 数 为 O(n 十 m)。 总 之 ,可 以 在 8(mn) 时 间 内 完成 计算 文本 T.. n] PRR 
PL1..m] 的 最 佳 近似 匹配 。 


554 


第 11 章 文本 搜索 


11.3.3 程序 实现 


细心 的 读者 会 发 现 ,计算 两 个 单词 PW 的 最 小 编辑 距离 的 算法 11-9 和 计算 在 文 
本 工 中 查找 模式 P 的 最 佳 近似 匹配 的 算法 11-11 几乎 是 一 样 的 。 区 别 在 于 前 者 是 计 
算 PL1..: RI WOL. Se) A SERE B d[i, 门 ,而 后 者 是 计算 POLS T[1.. 门 的 所 有 后 
级 的 最 小 编辑 距离 ad [i, j]。 体 现在 算法 的 伪 代 码 上 , 仅 第 4 行 对 d[0, 站] 和 对 
ad[0, 门 的 赋值 不 同 , 前 者 赋值 为 j, 而 后 者 赋值 为 0。 这 是 因为 对 前 者 而 言 ,d[0, JIK 
示 空 串 e 转 换 为 W[1.. 门 需要 添加 j 个 字符 ;而 对 于 后 者 ,ad[0, j AR RP e HE TC1..] 
的 所 有 后 级 中 , 仅 与 空 串 e 最 匹配 。 这 样 ,此 处 仅 罗 列 出 算法 11-11 的 实现 代码 ,读者 
可 打开 源 文件 utility/textmatch. c 查看 本 章 其 他 算法 (不 包括 各 个 应 用 问题 中 所 列举 的 
算法 ) 的 实现 代码 。 


1 int * approximateMatch(char * p. char * 1){ 
2 int m=strlen(p), n=strlen(t); 

3 int * ad= (int * )malloc((m+1) * (n+1) * sizeof(int)) ; 
4 for(int j=0; j<=n; j++) 

5 ad[j]—0; 

6 for(int i=1; i —m; i++) 

7 ad[i* (n+1)]=is 

8 for (int i=1; i<=m; i++) ( 

9 for Cint j=1; j<=n; j++) { 


10 int a 一 min(ad[(i 一 1) * Cn 十 1) 十 和 ,ad[ix Cn 十 1) 十 j 一 1]) 十 1， 
11 b-—ad[G— D * Cn 十 1) 十 j 一 1]; 

12 if(p[i 一 1]! =t{j-1)b++; 

13 ad[i* (n+1)+j]=min(a, b); 

14 ) 

15 ) 

16 return ad; 

17) 


程序 11-6 ”实现 算法 11-11 的 C 函数 


程序 11-6 的 代码 结构 与 算法 11-11 的 伪 代 码 结构 是 一 样 的 。 此 处 仅 向 读者 指出 ,与 本 
书 之 前 的 做 法 相同 ,用 一 维 数组 按 行 优先 方式 存储 二 维 数组 ad[0.. m. 0..n]. 58 3 行为 此 
数组 分 配 存储 空间 。 利 用 本 函数 返回 的 数组 ad, 在 该 数组 的 最 后 一 行 找到 最 小 值 adLm', t], 
调用 下 列 实现 算法 11-12 的 函数 solution(t. ad. m, O , 即 可 展示 文本 t 中 模式 p 的 最 佳 匹配 。 


1 void solution(char * t. int * ad, int i, int j){ 

2 if(i==0) 

3 return; 

4 int n—strlen(O ; 

5 ifCCad[i * (n +1) 0j] —ad[G— D * (n +1) +j—1))| | (ad[ix (9 +1) 0j]— —ad[G— 1) * 
GE D-cj-1]H-10( 
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6 solution(t, ad, i—1. j 一 1); 

7 putcharCt[j—1]); 

8 Jjeleif(ad[i* (n+1)+j]==ad[i* (n+ D+j—1]+D{ 
9 


solution(t, ad, i. j— D; 


10 putchar(t[j—1]); 

11 }else 

12 solution(t, ad, i—1, j); 
13 } 


程序 11-7 实现 算法 11-12 的 C 函数 


程序 11-7 的 代码 结构 与 算法 11-12 的 为 代码 结构 也 是 一 样 的 。 注 意 , 由 于 是 按 行 优先 
方式 将 二 维 数组 ad[0.. m. 0..nj 存 储 于 一 维 数组 ad[0..n x* m 十 1], 因 此 访问 ad[i, jj 的 形式 
是 ad[i * (n+1)+j]. 


11.3.4 应 用 


String Matching 

Description 

It's easy to tell if two words are identical 一 just check the letters. But how do you tell 
if two words are almost identical? And how close is "almost"? 

There are lots of techniques for approximate word matching. One is to determine the 
best substring match. which is the number of common letters when the words are com- 
pared letter-by letter. 

The key to this approach is that the words can overlap in any way. For example. con- 
sider the words CAPILLARY and MARSUPIAL. One way to compare them is to overlay 
them: 

CAPILLARY 

MARSUPIAL 

There is only one common letter CA). Better is the following overlay: 

CAPILLARY 

MARSUPIAL 

with two common letters (A and R). but the best is: 

CAPILLARY 

MARSUPIAL 

Which has three common letters (P. I and L). 

The approximation measure appxCword; . word, ) for two words is given by: 


common letters * 2 


length( word1) +length( word2) 
Thus. for this example. appx(CAPILLARY. MARSUPIAL) =6/(9+9) —1/3. Ob- 
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viously, for any word W appx(W, W)=1, which is a nice property, while words with no 
common letters have an appx value of 0. 

Input 

The input for your program will be a series of words. two per line. until the end-of — 
file flag of-1. 

Using the above technique. you are to calculate appx() for the pair of words on the 
line and print the result. 

The words will all be uppercase. 

Output 

Print the value for appx() for each pair as a reduced fraction. Fractions reducing to 
zero or one should have no denominator. 

Sample Input 

CAR CART 

TURKEY CHICKEN 

MONEY POVERTY 

ROUGH PESKY 

AA 

=f 

Sample Output 

appx(CAR,CART) —6/7 

appx( TURKEY CHICKEN) = 4/13 

appx( MONEY POVERTY) —1/3 

appx(ROUGH, PESKY) =0 

appx(A,A)=1 


l. 问题 描述 与 分 析 


寻求 两 个 单词 的 近似 匹配 程度 有 很 多 方法 ,本 问题 就 给 出 了 一 个 方法 : 

计算 Wa 和 W 在 任何 交错 形式 下 ,对 应 字符 相同 的 个 数 , 取 其 中 最 大 者 的 2 倍 除 以 两 
个 单词 长 度 的 和 作为 它们 的 近似 匹配 度 。 

题 中 给 出 两 个 样 例 单词 : W,;—CAPILLARY.W; 二 MARSUPIAL。 两 者 的 几 种 交错 形 
式 如 图 11-15 所 示 。 


cpappri[r[r[A[R|v] [ela i MR Y c| a ARY 
M[A[R[s[u|P|1[A[t A[R[s[u|]P]i[A[t] [MA[R[s[U[PTH] ATE 
(a) (b) (o 


Fi 11-15 在 不 同 交错 形式 下 对 应 字符 相同 数 的 计算 


图 11-15 反映 了 Wi 二 CAPILLARY,W, —MARSUPIAL 在 不 同 交错 形式 下 对 应 字符 
相同 数 的 计算 。 图 11-5(a) 中 展示 的 形式 下 ,只 有 一 个 对 应 相同 字符 A( 表 示 成 带 有 阴影 的 
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格子 )。 图 11-15(b) 中 有 两 个 对 应 相同 的 字符 A 和 R。 图 11-15(c) 中 有 3 个 对 应 相同 的 字 
符 P.T 和 LL。 注意 ,Wi Al We 的 交错 形式 可 以 通过 固定 一 个 而 向 左 移动 男 一 个 有 释 交 形成 。 
例如 图 11-15(b) 可 视 为 固定 Wi ,移动 W: 形成 ;而 图 11-15(c) 可 视 为 固定 W, ,移动 W 


2. 算法 描述 
要 解决 本 题 ,首先 需要 有 一 个 计算 给 定 的 两 个 单词 在 任意 交错 形式 下 最 大 的 对 应 相同 


字符 数 。 下 列 算法 给 出 了 这 个 计算 过 程 。 


COMMON-LETTERS(word, , word: ) 

1 m--length[ word, ], n<length[ word: ] 

2 maz< 0 

3 for i<-1 tom 户 固定 word, ,移动 word: 

4 do count<-0 户 对 应 字符 相同 数 计数 器 
5 for j<1 to min{n, m—i+1} 

6 do if wordi[it+j—1]=word;[j] 
7 then count<-count+1 

8 if count>max D BRESOGEN SE ER [6] Be JC 
9 then maz--count 

10 fori<-1 to n D [SE word: ,移动 word, 

11 do count<-0 


12 for j*-1 to min(m, n—i+1} 

13 do if word; [i--j—1]— word [j] 
14 then count<-count+1 

15 if count>max 

16 then maz--count. 


17 return max 
算法 11-13 计算 两 个 单词 任何 交错 形式 下 最 大 的 对 应 相同 字符 数 的 过 程 
注意 ,min{n, m 一 i 十 1} 表 示 固 定 W, ,移动 W, 时 ,交错 部 分 的 长 度 。 类 似 地 ,min{m, n 


一 i 十 1) 表 示 固 定 word; ,移动 word, 时 ,交错 部 分 的 长 度 。 显 然 , 过 程 COMMON-LET- 
TERS 的 运行 时 间 为 6(mn)。 利 用 COMMON-LETTERS(word, ,word; ) ,按照 下 列 公式 
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COMMON-LETTERS(word ; ,word;) 
length (word, ) + length (word ;) 


计算 出 word, 和 word, 的 近似 程度 算法 过 程 如 下 。 


APPXvord| , wordz) 

1 m<length[ word, ], n<-length[Lword; ] 

2 max<-COMMON-LETTERS(word! , word;) 
3 return 2 * max/ (m+n) 


算法 11-14 ”计算 两 个 单词 近似 匹配 程度 的 过 程 
算法 APPX 的 运行 时 间 也 是 Onn). 
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3. 程序 实现 


实现 算法 11-13 的 C 函数 代码 如 下 。 其 代码 结构 与 算法 11-3 的 为 代码 结构 是 一 致 的 ， 
读者 可 对 照 研读 。 


1 int commonLetters(char * wordl, char * word2){ 

2 int max=0; 

3 int m=strlen(word1), n=strlen(word2) ; 

4 for(int i=0; i<m; i 十 十 ){ 

5 int count=0, l=n<m— i? n:m—i; /*1 表 示 交 错 部 分 长 度 min{n, m—i) * / 
6 for(int j=0; jl; j++) 

if(word1[i+j]==word2[j]) 

8 

9 


count+ +; 

if(count> max) 
10 max- count; 
11 ) 
12 for(int i=0; i<n; it+){ 
13 int count —0, l=m<n— i? m:n—i; /*1 表 示 交 错 部 分 长 度 minim, n—i) * / 
14 for(int j=0; jl; j++) 
15 if( word2[i+j]==word1[j]) 
16 count+ +; 
17 if(count> max) 
18 max- count; 
19 ) 
20 return max; 
21) 


程序 11-8 ”实现 算法 11-13 的 C MR 
实现 算法 11-14 的 C 函数 定义 如 下 。 


1 Rational appx(char * wordl, char * word2){ 


2 int numerator 一 commonLetters(wordl word2), 
3 denominator= strlenCwordl) +strlen( word2) ; 

4 Rational r= (2 * numerator, denominator. 07 ; 

5 normalize( &r) ; 

6 return r; 

7) 


程序 11-9 实现 算法 11-14 的 C 函数 
程序 11-9 的 代码 结构 与 算法 11-14 的 伪 代 码 结构 也 是 一 样 的 。 要 注意 的 是 ,利用 4.5.3 
节 中 定义 的 有 理 数 结构 体 类 型 Rational 表示 两 个 单词 近似 程度 ,以 满足 题目 对 输出 格式 的 
要 求 。 其 中 第 5 行 调用 的 函数 normalize 负责 对 有 理 数 进行 约 分 操作 。 解 决 该 问题 完整 的 
程序 代码 存储 于 源 文件 chapl1/ String Matching/ StringMatching. c. 
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本 书 的 最 重要 目标 之 一 是 和 读者 一 起 体验 算法 理论 对 程 设计 时 的 指导 作用 ,以 及 程序 
设计 实践 反 过 来 对 加 深 对 算法 思想 的 理解 的 过 程 。 本 书 的 前 10 章 在 讨论 经 典 问 题 算 法 的 
同时 用 C 语言 将 其 一 一 实现 为 通用 的 功能 函数 ,形成 了 一 个 颇具 规模 的 函数 库 。 这 些 函 数 
的 源 代码 通过 反复 调试 ,存储 于 代码 资源 文件 夹 laboratory 中 ,提供 给 读者 研读 、 实 验 。 根 
据 自 己 在 实践 中 的 需要 加 以 扩展 ,成 为 读者 自己 的 解决 实际 应 用 问题 的 函数 库 。 作 为 本 书 
的 结束 ,本 章 向 读者 介绍 如 何 使 用 这 些 代码 的 基本 要 点 。 


12.1 ARABS 


首先 将 书 中 实现 的 函数 原型 声明 所 在 的 头 文件 罗列 出 来 , 供 读者 检索 、 查 阅 。 书 中 的 这 
些 实现 的 基础 数据 类 型 及 基础 函数 分 门 别 类 地 存储 于 utility、datastructure、algebra、geom- 
etry,numbertheory ,btrack,dprog,greedy 和 graph 9 个 文件 夹 内 。 本 节 按 它们 在 书 中 出 现 
的 先后 顺序 罗列 出 各 文件 夹 中 的 头 文件 及 其 内 容 。 


12.1.1 基本 应 用 类 函数 
1, 串 输入 输出 流 头 文件 strstream. h 


typedef struct{ 

char * begin; /* 输 入 流 首 地 址 */ 

char * current; /* 输 入 流 当前 读 取 位 置 */ 
}StrInputStream; /* 串 输入 流 类 型 * / 
void initStrInputStream(StrInputStream * ,char * ); /* 初 始 化 输入 流 * / 
int sisEof(StrInputStream * ) ; / * 检测 输 入 流 是 否 结束 * / 
int readInt(StrInputStream * ,int * ) ; / * 从 输入 流 中 读 取 整数 * / 
int readLong(StrInputStream * ,long * ); / * 从 输入 流 中 读 取 整 数 * / 
int readLongLong(StrInputStream * ,long long * ); / * 从 输入 流 中 读 取 整 数 * / 
int readDouble(StrInputStream * .double * ) ; / * 从 输入 流 中 读 取 双 精 度 浮 点 数 * / 
int readChar(StrInputStream * ,char * ); / * 从 输入 流 中 读 取 字符 * / 
int readString(StrInputStream * ,charx ); / * 从 输入 流 中 读 取 字符 串 * / 
void sisRewind(StrInputStream * ); /< 输入 流 还 原初 始 设置 * / 
typedef struct{ 

char * begin; / * Sg i LEE RE * / 

char * current; /* 输出 流 当前 写 入 位 置 * / 

int length; /* 输 出 流 长 度 * / 


}StrOutputStream; /* 串 输出 流 类 型 / 
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void initStrOutputStream(StrOutputStream * ,int); 
void freeStrOutputStream(StrOutputStream * ) ; 
int sosFull(StrOutputStream * ) ; 

int writeInt StrOutputStream * ,int) ; 

int writeDouble(StrOutputStream * ,double) ; 
int writeChar(StrOutputStream * ,char) ; 

int writeString(StrOutputStream * , char * ) ; 
void sosRewind(StrOutputStream * ) ; 
StrOutputStream ssout; 

void putInt(int * ) ; 

void putChar(char * ) ; 

void putDouble(double * ) ; 

void putString(char * ) ; 


2. 基本 数据 比较 头 文件 compare. h 


int intGreater(int const * x.int const * y); 

int intLess(int const * x,int const * y); 

int charGreater(char const * x.char const * y); 
int charLess(char const * x.char const * y); 

int strGreater(char const * * x,char const ** y); 
int strLess(char const * * x,char const * * y); 
int floatGreater(float const * x,float const * y); 
int floatLess(float const * x,float const * y); 


int doubleGreater(double const * x,double const * y); 


int doubleLess(double const * x.double const * y); 


/=* 初 始 化 输出 流 * / 


/ 检测 输出 流 满 * / 

/* 向 输出 流 写 人 整数 * / 

/ * 向 输出 流 写 人 浮 点 数 * / 
/ * 向 输出 流 写 人 字符 * / 
/* 向 输出 流 写 人 字符 串 * / 
LE 输出 流 还 原初 始 设置 * / 
/* 全 局 串 输出 流 对象 * / 
/* 向 ssout 写 人 整数 */ 
/* 向 ssout 写 和 人 字符 * / 
/* 向 ssout 写 人 浮 点 数 * / 
/* 向 ssout 写 人 字符 串 * / 


/* 整 型 数据 大 于 比较 * / 

/* 整 型 数据 小 于 比较 * / 

/* 字符 数据 大 于 比较 / 

/* 字符 数据 小 于 比较 * / 

/* 字符 串 数据 大 于 比较 / 

/* 字 符 串 数据 小 于 比较 * / 

/* 单 精度 浮 点 数据 大 于 比较 * / 
/* 单 精度 浮 点 数据 小 于 比较 * / 
/* 双 精度 浮 点 数据 大 于 比较 * / 
/* 双 精度 浮 点 数据 小 于 比较 * / 


int unsignedGreaterCunsigned const * x,unsigned const * y); /* 无 符号 整数 大 于 比较 * / 
int unsigned_long_longGreater(unsigned long long const * x, 


unsigned long long const * y); 
int dblLess(double const * * x,double const ** y); 


3. 随机 数 发 生 器 头 文件 randomn. h 


int randomNumber(int p, int q); 


4. 交换 变量 数据 头 文件 swap.h 


void swap(void * x.void * y.int size); 


5. 数组 合并 头 文件 merge. h 


/* 无 符号 长 整数 大 于 比较 * / 


/* 双重 指针 指引 的 双 精 度数 据 大 于 比较 * / 


/ * 3& ll p 一 q 之 间 的 一 个 随机 整 型 数 * / 
unsigned long long RangedRandom( unsigned long long range min. unsigned long long range_max); 
/ * 3&1] min 一 max 之 间 的 一 个 随机 长 整 型 数 * / 


/* 交换 x y 指向 的 变量 的 值 * / 


void merge(void * a, int size, int p. int q，int r.int( * comp)(void * ,void * )); 


/ * 有 序数 组 aLp..q] .aLq 十 1.. 口 合并 为 有 序数 组 a p..r] * / 


6. 链表 合并 头 文件 listmerge. h 


void listMerge(LinkedList * A. 
ListNode * p, ListNode * q, ListNode * r); 


/* 合 并 链表 A 中 的 有 序 子 序列 p~q、q~r 为 有 序 序列 * / 
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7. 数组 归并 排序 头 文件 mergesort. h 


void mergeSort(void * a,int size,int p,int r,int( * comp) (void * ,void * )); 


/* 对 数组 a[p. .器 做 归并 排序 * / 
8. 链表 归并 排序 头 文件 listmergesort. h 


void listMergeSort(LinkedList * A, ListNode * p, ListNode * r); /* 链表 A 的 归并 排序 * / 


9. 数组 划分 头 文件 partition. h 


long partition(void * a,int size,int p,int r,int( * comp)(void * ,void * )); 
/ * 对 数组 ap. . 口 划分 ,返回 分 界 点 下 标 / 
long randmizedPartition(void * a,int size,long p,long r.int( * comp)(void * ,void * )); 


/ * 对 数组 a[p. . 口 划分 的 随机 版 本 * / 
10. 链表 划分 头 文件 listpartition. h 


ListNode * listPartition(LinkedList * A, ListNode * p,ListNode * r); / * 链表 划分 / 
ListNode * rndListPartition(LinkedList * A, ListNode * p,ListNode * r); 
/ * 链表 划分 的 随机 版 本 * / 


11. 数组 快速 排序 头 文件 quicksort. h 


void quickSort( void * a, int size,int p,int r,int( * comp) (void * ,void * )); 
/ * 对 数组 a[p. .可 做 快速 排序 * / 


12. 链表 快速 排序 头 文件 listquicksort. h 


void listQuickSort(LinkedList * A, ListNode * p. ListNode * r); /* 链 表 的 快速 排序 * / 


13. 数组 选择 头 文件 select. h 


void * select(void * a, int size, int p, int r.int i,int( * comp)(void * ,void * )); 


/* 在 数组 a[p.. 口中 找 第 i 小 的 元 素 * / 
14. 链表 选择 头 文件 listselect. h 


ListNode * listSelect(LinkedList * a, ListNode * p, ListNode * r,int i); 
/* 在 链表 a 中 找 q~r 之 间 的 第 i 小 元 素 * / 


15. 计数 排序 头 文件 countsort. h 


void countSort(unsigned * a.int n); / * 计数 排序 * / 


16. 数组 最 大 之 最 小 值 头 文件 most. h 


int most(void * a, int n. int size, int( * comp)(void * ,void * )); 


/* 计 算数 组 aL0..n 一 1 中 的 最 大 /最 小 值 的 下 标 * / 


17. 基本 数据 输出 头 文件 output.h 


void intOutput(void * x); /= 输出 x 指 向 的 整 型 数据 * / 
void charOutput(void * x); /* 输 出 x 指 向 的 字符 型 数据 * / 
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void doubleOutput(void * x); /< 输出 x 指 向 的 双 精 度 浮 点 型 数据 * / 
void floatOutput(void * x); /=* 输 出 x 指 向 的 单 精 度 浮 点 型 数据 * / 
void stringOutput(void * x); / * 输出 x 指 向 的 字符 串 型 数据 * / 


18. 线性 查找 头 文件 search. h 


int linearSearch(void * a,int size, int n. void * x,int( * comp) (void * ,void * )) ; 


/* 在 数组 a[0..n 一 1] 中 线性 查找 值 x x* / 
19. 堆 操作 头 文件 heap. h 


int left(int i); /* 计 算 a[ 让 的 左 孩 子 下 标 */ 
int right(int D ; / * HA a[ 训 的 右 孩子 下 标 / 
int parentCint i) ; / * YE aU ERR / 
void heapify(void * a,int size, int i,int heapSize,int( * comp) (void const * ,void const * )); 

/ * 维护 a[ 让 的 堆 性 质 * / 
void buildHeap(void * a,int size, int length,int( * comp) (void const * ,void const * )); 

/* 创建 堆 * / 


1.2 数据 结构 类 


1. 序 偶 头 文件 pair.h 
typedef struct { / * 用 来 存储 两 个 指针 的 结构 体 * / 


void * first; 


void * second; 


} pair; 

pair make pair(void * f, void * d); / * 创建 pair 对象 */ 

2. 链表 头 文件 list. h 

typedef struct ListNode{ /=* 结 点 类 型 结构 体 * / 
void * key; /* 关键 值 指针 * / 
struct ListNode * prev; / x 前 驱 结 点 指针 */ 
struct ListNode * next; /* 后 继 结 点 指针 */ 

) ListNode; 

ListNode * createListNode( void * d, int size) ; /* 创建 结 点 * / 

void clrListNode(ListNode * x, void( * proc) (void * )) ; /* 清理 结 点 * / 

typedef struct { / * 链表 类 型 结构 体 */ 
size_t eleSize; /* 元素 数据 存储 宽度 * / 
int ( * comp) (void * , void * ); / * 元 素数 据 比 较 规则 * / 
ListNode * nil; / * dift * / 
int n; /=* 元 素 个 数 * / 

) LinkedList; 

LinkedList * createList(unsigned long size, int( * comp) (void * ,void * )) ; — /* 创建 新 链表 * / 

void clrList(LinkedList * L, void( * proc) (void * )) ; /* 清 理 链表 * / 

int listEmpty( LinkedList * ) ; /* 检测 链表 是 否 为 空 * / 


563 


从 算法 到 程序 (第 2 NO 


564 


ListNode * listSearch( LinkedList * L, void * e); 


void listInsert(LinkedList * L, ListNode * a, void * k); /* 在 工 的 结 点 a 前 插入 key 为 k 的 结 点 */ 


void listPushFront(LinkedList * L, void * k); 
void listPushBack(LinkedList * L, void * k); 
void listDelete(LinkedList * L, ListNode * e); 


void listTraverse(LinkedList * L, void( * proc) (void * )) ; 


ListNode * advance(ListNode * i,int d); 
int distance(ListNode * p. ListNode * r); 
LinkedList * listClone(LinkedList * ) ; 


3. 栈 头 文件 stack. h 


typedef struct( 
LinkedList * L; 
ListNode * top; 
) Stack; 
Stack * createStack( unsigned long size); 
void clrStack(Stack * S, void( * proc) (void * )) ; 
int stackEmpty(Stack * S); 
void push(Stack * S,void * k); 
ListNode * pop(Stack * S); 


4. 队列 头 文件 queue. h 


typedef struct { 
LinkedList * L; 


ListNode * head, * tail; 
) Queue; 
Queue * createQueue( unsigned long size) ; 
void clrQueue(Queue * Q, void( * proc) (void * )); 
int queueEmpty (Queue * Q); 
void enQueue(Queue * Q,void * k); 
ListNode * deQueue(Queue * Q); 


5. 优先 队列 头 文件 pqueue. h 


typedef struct { 

void * heap; 

int eleSize; 

int length; 

int heapSize; 

int( * compare) (void const * ,void const * ); 
) PQueue; 


/* 在 链表 中 查找 * / 


/* 在 表 首 插入 */ 

/* 在 表 尾 插入 */ 

/* 在 链表 中 删除 结 点 e* / 
/* 遍历 链表 */ 


/* 栈 类 型 */ 
/* 链 表 属 性 */ 
/* 栈 顶 属 性 * / 


/* 创建 空 栈 * / 


/* 检测 栈 空 * / 
/* 压 栈 操作 * / 
/弹出 操作 */ 


/ * 队列 类 型 * / 
/* 链 表 属 性 * / 
/* 队 首 队 尾 属性 * / 


/ * 创建 空 队列 */ 
/* 清理 队列 空间 * / 
/* 检测 队列 空 * / 
/* 人 队 操作 * / 

/* 出 队 操 作 x*/ 


PQueue * initPQueue(int size,int n,int( * comp) (void const * ,void const * )); 


void pQueueClr(PQueue * q); 

int empty(PQueue * 9); 

void enQueue(PQueue * q.void * e); 
void * top( PQueue * q); 
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void * deQueue(PQueue * q); 
void fix(PQueue * q); 


6. — XPA Sr fF binarytree. h 


typedef struct node! 
Struct node * p; 
struct node * left; 
struct node * right; 
void * key; 
} BTreeNode; 
BTreeNode * creatBTreeNode(void * key, int size) ; 
void clrBTreeNode( BTreeNode * r,void( * proc) (void * )) ; 


/* 父 结 点 指针 */ 

/ * 左 孩 子 结 点 指针 */ 
/* 右 孩 子 结 点 指针 * / 
/* 数据 域 指 针 */ 

/* 二叉树 结 点 类 型 */ 
/* 创建 结 点 * / 

/ * 清理 二 叉 树 结 点 * / 


BTreeNode * creatBTree(void * k, int size, BTreeNode * l, BTreeNode * r); /* 创建 树 * / 


void clrBTree(BTreeNode * r,void( * proc) (void * )); 
void inorderTreeWalk (BTreeNode * r, void ( * proc) (void * )); 


void preorderTreeWalk(BTreeNode * r, void ( * proc) (void * )); 


/ * 清理 二 叉 树 * / 
/ * 中 序 遍 历 以 r 为 根 的 二 叉 树 * / 
/* 前 序 遍历 * / 


void postorderTreeWalk(BTreeNode * r, void ( * proc (void * ); / * 后 序 遍 历 * / 


7. 红 - 黑 树 头 文件 redblacktree. h 


typedef enum (RED, BLACK} Color; 
typedef struct node{ 
struct node * p; 
struct node * left; 
struct node * right; 
Color color; 
void * key; 
) RBNode; 
RBNode * creatRBNode( void * key, int size); 
void clrRBNode( RBNode * r,void( * proc) (void * )); 
typedef struct ( 
unsigned nodeSize; 
int ( * comp) (void * , void * ); 
RBNode * root; 
RBNode * nil; 
) RBTree; 
RBTree * creatRBTree(int size, int( * comp) (void * ,void * )); 
void clrRBTree(RBTree * t, void( * proc) (void * )) ; 
void inorderRBWalk(RBTree * t. void ( * proc) (void * )) ; 
/* 二 叉 搜 索 树 的 操作 */ 
RBNode * rbMini(RBTree * t); 
RBNode * rbMax(RBTree * t); 
RBNode * treeSuccessor( RBNode * r); 
RBNode * treePredecessor( RBNode * r); 
RBNode * rbSearch( RBTree * t. void * k); 
RBNode * rbInsertC RBTree * t, void * key); 


/*#* 二 叉 树 结 点 类 型 * / 
/ * 父 结 点 指针 * / 

/* 左 孩子 结 点 指针 * / 
| * 右 孩 子 结 点 指针 * / 


/ 数据 域 指 针 */ 


/* 创建 结 点 * / 
/* 清 理 二 叉 树 结 点 * / 


/* 创建 空 树 * / 
/* 清理 二 叉 树 / 
/ * 中 序 遍历 以 r 为 根 的 二 叉 树 / 


/* 计算 最 小 值 */ 

/* 计 算 最 大 值 * / 

/* 计 算 r 的 后 继 */ 

/* 计 算 r 的 前 驱 */ 

/ * 在 搜索 树 中 查找 */ 
/* 向 搜索 树 插入 元 素 * / 


565 


从 算法 到 程序 (第 2 NO 


12 


566 


RBNode * rbDelete(RBTree * t; RBNode * x); 


8. 散 列 表 头 文件 hstb.h 


typedef struct { 

LinkedList ** table; 

size tm; 

size t n; 
) Hash Table; 
Hash, Table * createTable(int c); 
void clrTableCHash, Table * t); 
int tbIsEmptyCHash Table * t); 


int hashInsert( Hash, Table * t, unsigned long long key); 
int inHashTable( Hash_Table * t, unsigned long long key) ; 
int hashDelete( Hash Table * t, int unsigned long long ele) ; 


9. 大 整数 散 列 表 头 文件 hstbl.h 


typedef struct { 
LinkedList ** table; 


BigInt m; 
size t n; 
) HashTable; 
HashTable * CreateTable(long c); 
void ClrTable( HashTable * t) ; 
int TbIsEmpty( HashTable * t); 
int HashInsert( HashTable * t, BigInt key); 
int InHashTable( HashTable * t, BigInt key); 
int HashDelete( HashTable * t, BigInt key); 


13 代数 记 算 类 函数 


1. 矩阵 头 文件 matrix. h 


typedef struct{ 

double * tab; 

int row,col; 
) Matrix; 
Matrix newMatrix(int, int) ; 
Matrix newMatrixByArry(double * , int, int) ; 
void clrMatrix( Matrix) ; 
void printMatrix( Matrix) ; 
Matrix matrixAdd( Matrix. Matrix) ; 
Matrix matrixDiff( Matrix. Matrix) ; 
Matrix matrixMultiply( Matrix. Matrix) ; 
Matrix transform( Matrix) ; 


void swapRows(Matrix a, int i, int j); 


/ * hash R445 #49 * / 
/ x 槽 位 数组 * / 
/* 模 位 数 */ 

/* 元素 个 数 * / 


/* 创建 具有 个 槽 位 的 hash X * / 


/* 检 测 表 空 * / 

/#* 向 表 t 中 插 人 元素 key* / 
/* 在 表 t 中 查找 关键 值 key * / 
/* 在 表 t 中 删除 元 素 ele / 


/* hash 表 结 构 * / 
/* 槽 位 数组 * / 
/* 槽 位 数 * / 

/* 元 素 个 数 * / 


/ * 创建 具有 ec 个 槽 位 的 hash 表 * / 


/ * 检测 表 空 x / 

/* 向 表 t 中 插入 元 素 key*/ 
/* 在 表 t 中 查找 关键 值 key* / 
/* 在 表 t 中 删除 元 素 key* / 


/* 和 矩阵 类 型 定义 * / 
/< 二 维 数 表 * / 
/<* 行 数 、 列 数 */ 


/< 生成 矩阵 * / 

/< 用 数组 数据 生成 矩阵 * / 
/ x 清理 矩阵 空间 * / 

/< 输出 矩阵 * / 

/ * $e AIM * / 

/ * BEER» / 

/ * SBFERISE * / 

/* 和 矩阵 转 置 * / 

/ * 交换 两 行 */ 
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typedef struct{ 
Rational * tab; 
int row,col; 
) rMatrix; 
rMatrix rnewMatrix(int, int); 
rMatrix rnewMatrixByArry( Rational * , int, int); 
void rclrMatrix( Matrix) ; 
void rprintMatrix(rMatrix a) ; 


void rswapRows(rMatrix a, int i, int j); 


2. LUP 分 解 头 文件 lup. h 


Matrix lupDecomposition( Matrix a, int * pi); 
double * lupSolve( Matrix lu, int * pi, double * b); 
Matrix matrixInverse( Matrix a) ; 


rMatrix rlupDecomposition(rMatrix a, int * pi); 


3. 复数 头 文件 complex. h 


typedef struct { 
double real; 
double magic; 
) Complex; 
void printComplex( Complex) ; 
int isZero( Complex) ; 
Complex compSum(Complex; Complex) ; 
Complex compDiff(Complex, Complex) ; 
Complex compProd( Complex, Complex) ; 


Complex compQuot( Complex. Complex) ; 


4. 复 系数 多 项 式 头 文件 polynomial. h 


typedef struct{ 

Complex * coeff; 

int degree; 
}Polynomial; 
Polynomial newPoly(int n) ; 
Polynomial newPolyByArry(double * , int n); 
void clrPoly( Polynomial) ; 
void printPoly( Polynomial) ; 
Polynomial polySum( Polynomial, Polynomial) ; 
Polynomial polyProd(Polynomial f, Polynomial g); 
double horner( Polynomial, double) ; 


5. FFT X: xc ff fft. h 


Complex * fft(Complex * a, int n. int inv); 
Complex * fftInverse(Complex * a. int n); 


/=* 二 维 数 表 * / 
/* 行 数 、 列 数 */ 


/* 生 成 矩阵 * / 
/* 用 数组 数据 生成 矩阵 * / 
/ * 清理 和 矩阵 空间 * / 


/* 交换 两 行 * / 


/ * 对 和 矩阵 a 做 lup 分 解 * / 


/* 基 于 lup 分 解 解 线性 方程 组 * / 


/ * 计算 矩阵 a 的 逆 矩 阵 * / 
/< 有理数 矩阵 a 的 lup 分 解 * / 


/* 实 部 */ 

/* 虚 部 */ 

/* 复数 类 型 * / 
/* 复数 的 输出 * / 
/* 检测 是 否 为 0*/ 
/* 复 数 相 加 * / 
/* 复数 相 减 * / 
/* 复数 相 乘 * / 
/* 复数 相 除 * / 


/* 系数 表 */ 

/* 次 数 */ 

/* 复 系数 多 项 式 类 型 * / 

/* 生 成 多 项 式 * / 

/* 用 数组 数据 生成 多 项 式 * / 
/* 清理 多 项 式 空间 * / 

/* 输 出 多 项 式 * / 

/* 多 项 式 的 和 */ 


/< 起 纳 法 计算 多 项 式 的 值 * / 


/* 向 量 a 的 fft 变 换 */ 
/* 向 量 a 的 fft 逆 变换 x*/ 
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6. 实 系数 多 项 式 头 文件 poly. h 


typedef struct{ 

double * coeff; /* 系数 向 量 */ 

int degree; /* 次 数 */ 
}Poly; /* 实 系数 多 项 式 类 型 * / 
Poly newPoly(int n); / * 创建 n 次 多 项 式 */ 
Poly newPolyByArry(double * a, int n); /* 用 实 系数 向 量 a 创建 n 次 多 项 式 * / 
void clrPolyCPoly) ; / * 清理 多 项 式 存储 空间 * / 
void printPoly(Poly) ; /* 输 出 多 项 式 * / 
void polyAssign( Poly * ,Poly) ; / * Wis WE n / 
Poly polySum(Poly, Poly) ; /* 多 项 式 相 加 * / 
Poly polyProd(Poly f, Poly g); / * 多 项 式 相 乘 * / 
double horner(Poly, double) ; / * 起 纳 法 求 值 * / 
Poly derivativeCPoly) ; / * 多 项 式 导 数 * / 
void nomalPoly( Poly * ) ; / * 规格 化 多 项 式 * / 
7. 有 理 数 头 文件 rational. h 
typedef struct{ 

unsigned numerator; /* YF */ 

unsigned denominator; / * Fy 8 8 / 

int sign; /* 符 号 */ 
) Rational; /* 有 理 数 类 型 * / 
void printRational( Rational) ; /* 输出 有 理 数 * / 
int rationalIsZero(RationaD ; / * 检测 有 理 数 是 否 为 0* / 
int valueCompare( Rational a, Rational b) ; /* 有 理 数 大 小 比较 * / 
void normaliz( Rational * ) ; / * 规格 化 有 理 数 * / 
Rational rationalSum( Rational , Rational) ; / * 有 理 数 相 加 * / 
Rational rationalDiff( Rational, Rational) ; /<* 有 理 数 相 减 * / 
Rational rationalProd( Rational, Rational) ; /* 有 理 数 相 乘 * / 
Rational rationalQuot(Rational, Rational) ; /< 有理数 相 除 * / 

12.1.4 计算 几何 类 函数 

1. 平 面 点 头 文件 point. h 
typedef struct{ /x* 平 面 点 */ 

double x,y; /* 横 坐 标 与 纵 坐标 * / 
) Point; 
double dist(Point * a, Point * b); / * 两 点 间距 离 * / 
double crossProduct(Point * a, Point * b); /* XBix/ 
Point sub(Point *a, Point * b); / * 两 点 向 量 差 */ 


int direction(Point * p0, Point * pl, Point * p2); / * 判断 向 量 p2p0 从 向 量 plp0 绕 po 的 旋转 方向 * / 
int inBox(Point * pi, Point * pj. Point * pk); /* 检 测 pk 是 否 落 于 以 pi. pj 为 对 角 线 的 矩形 内 * / 
int InBox(Point * pi, Point * pj, Point * pk); 
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double pabs(Point * a); 


void normalize(Point * a); 


int segmentsIntersect(Point * pl, Point * p2, Point * p3, Point * p4); 


double psudoPolarAngle(Point * a, Point * b); 


/ * 检测 线段 plp2 MAE p3p4 是 否 相 交 * / 
/ * 计算 伪 极 角 * / 


Point jointPoint(Point * al, Point * bl, Point * a2, Point * b2); 


void pointRotate(Point * p, double theta) ; 


2. 平面 线段 头 文件 segment. h 


typedef struct{ 
Point point; 
int e; 
) EndPoint; 
int pointLess(EndPoint * a, EndPoint * b); 
typedef struct( 
EndPoint left; 
EndPoint right; 
double length; 
double tan; 
double yOffset; 
} Segment; 
Segment newSeg(Point * a, Point * b); 
EndPoint getLeft(Segment * a); 
EndPoint getRight(Segment * a); 
double getY (Segment * a, double x); 
EndPoint getLeft(Segment * a); 
EndPoint getRight(Segment * a); 
int segComp(Segment * a, Segment * b); 


int anySegmentIntersect( Segment * S, int n); 


3. 平面 点 集 凸 包头 文件 convexhull. h 


Point * grahamScan(Point * p. int n, int * m); 


/ * 计算 相交 线段 albl .a2b2 的 交点 * / 


/* 端点 坐标 * / 
/端点 标志 */ 
/ * 线段 端点 类 型 * / 
/ * 端点 比较 * / 


/* 左 端点 */ 

/* 右 端点 */ 

/* 长 度 */ 

/+ 斜率 * / 

/* 所 在 直线 在 y 轴 的 截 距 * / 
/* 线段 类 * / 

/* 构造 函数 * / 

/* 访问 左 端 点 */ 

/* 访问 右 端点 * / 

/ * 计算 线段 在 x 处 的 纵 坐 标 * / 


/ * 线段 比较 * / 


4. 平面 点 集 最 邻近 点 对 头 文件 closestpairpoints. h 


double closestPairPoints(Point * x, Point * y, int n); 


1.5 数论 计算 类 函数 


1. 大 整数 绝对 值 运 算 头 文件 valuecalc. h 


# define Base 1000000000 


int valueCompare(LinkedList * a, LinkedList * b); 


/< 计算 点 集中 最 邻近 点 对 距离 * / 


LinkedList * valueAdd(LinkedList * a. LinkedList * b); 
LinkedList * valueSub(LinkedList * a. LinkedList * b); 
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void valueDecreas(LinkedList * a. LinkedList * b); 

void valueReduplicate(LinkedList * a, long b); 

LinkedList * multedByDigit( LinkedList * a, long x) ; 

LinkedList * valueMulti(LinkedList * a, LinkedList * b); 

void dividedByDigit(LinkedList * a. long x, long * r); 

LinkedList * valueDivision(LinkedList * a, LinkedList * b, LinkedList * r); 


2. 大 整数 运算 头 文件 bigint. h 


typedef struct{ 

LinkedList * value; 

int sign; 
) BigInt; 
BigInt newIntByint(long long) ; 
BigInt newIntBystring(char *); 
void clrBigInt(BigInt * ) ; 
void intAssign(BigInt * a, BigInt b); 
void printInt(BigInt * ) ; 
char * toString(BigInt * a); 
int compareInt(BigInt * , BigInt * 2; 
int isZero(BigInt x); 
int isOne(BigInt a); 
BigInt negative(BigInt a); 
BigInt sum(BigInt, BigInO ; 
void increase(BigInt * , unsigned) ; 
BigInt diff(BigInt. BigInt) ; 
void decrease(BigInt * , unsigned) ; 
BigInt product(BigInt, BigInt) ; 
BigInt quotient(BigInt, BigInt) ; 
BigInt remainder(BigInt. BigInt) ; 


3. 最 大 公约 数 头 文件 gcd.h 

typedef unsigned long long ul int; 

typedef long long | int; 

ul int gcdCul int. ul inO ; 

ul int egcdCul int a, ul int b, Lint * x, Lint * y); 

BigInt euclid(BigInt, BigInt) ; 

BigInt extendedEuclid(BigInt, BigInt, BigInt * , BigInt * ); 


4. 模 线性 方程 头 文件 lequation. h 


long long mod(long long a. long long m) ; 


LinkedList * modularLinearEquationSolver( unsigned long long. /< 系数 */ 
unsigned long long. /* TE / 
unsigned long long /[* Ex)»; 


LinkedList * modularEquationSolver(BigInt, BigInt. BigInt) ; 
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5. EE 3L Sr fF exponent. h 
unsigned long lg2 unsigned long long n); 
unsigned long long modularExponentiation( unsigned long long a, 
unsigned long long b. 
unsigned long long modular) ; 
BigInt modularExponent(BigInt a, BigInt b, BigInt m); 
6. 素 数 检测 头 文件 primetest. h 
int isPrime(unsigned long long) ; / * 常规 判断 素数 * / 
BigInt random(BigInt a); / * 随机 大 整数 * / 
int millerRabin(unsigned long long n, int s); /* 随机 算法 判断 素数 * / 
int MillerRabin(BigInt n, int s); /* 判断 大 素数 * / 
7. 因数 分 解 头 文件 factor. h 
void factor(unsigned long n. RBTree * s); /* 长 整 型 数据 的 因数 分 解 * / 
void Factor(BigInt n, RBTree * s); /* 大 整数 的 因数 分 解 * / 
12.1.6 回溯 搜索 类 函数 
1. 组 合 问题 头 文件 combineproblem. h 
typedef struct{ /* 解 向 量 分 量 取 值 集合 类 型 */ 
LinkedList * list; /*5 e / 


ListNode * current; 
) ValueSet; 
void clrSet( ValueSet * set, void( * proc) (void * )) ; 


void clrOMG(ValueSet * * OMG, int n, void( * proc) (void * )) ; 


typedef struct! 
void * x; 
int k; 
} Solution; 
void clrSolution(Solution * ) ; 
int isPartial(void * , int) ; 
int isComplete( void * , int); 
LinkedList * backtrackiter( ValueSet * * OMG, int n); 
LinkedList * subSetTree(int n); 


LinkedList * permuteTree(void * origin, int size, int n); 


2. m- 着 色 问 题 头 文件 mcolor. h 


int * G, 

ns 

m; 
ValueSet * newSetO ; 
ValueSet * * makeOMGQ ; 


/ * list 当前 结 点 指针 / 


/ * 清理 取 值 集合 存储 空间 * / 


/* 清理 解 空间 * / 
/ * 合法 解 类 型 * / 
/* 解 向 量 * / 

/ * 解 向 量 长 度 * / 


/* 清理 合法 解 存储 空间 * / 


/* 部 分 合法 判断 * / 
/* 完 整合 法 解 判断 * / 


/* 组 合 问题 回溯 求解 */ 


/* 于 集 树 问题 回溯 求解 * / 
/* 排列 树 问 题 回溯 求解 * / 


/* 图 G 的 邻接 矩阵 * / 
/* 图 G 的 顶点 个 数 * / 
/* 颜色 种 数 * / 
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12.1.7 动态 规划 类 函数 


1. 最 长 公共 子 序列 头 文件 Ics. h 


int * lcsLength(void * x,void * y,int size, int m,int n.int( * comp)(void * ,void * )); 
void printLcs(int * c, int n. void * x,void * y. int size. int i. int j, int( * comp) (void * ,void * )， 
void( * pr (void * )); 


2. 头 文件 knapsack. h 


int * knapsack(int * w,int * v,int n,int c); 


int * buildSolution(int * m. int n,int * w, int c); 


3. 任意 点 对 最 短路 径 头 文件 floyd. h 


pair floydWarshall(double * w,int n); 
void printAllPairsShortestPath(int * pi,int n.int i,int j); 


12.1.8 仿 楚 策略 类 函数 
1. 相 容 活动 头 文件 actsel. h 


typedef struct { 
double s; 
double f; 
) Active; 


int * greedyActivitySelectorC Active * a, int n); 


2. Huffman 编码 头 文件 huffman. h 


typedef struct { 
int ch; 
int f; 
int parent; 
int * child; 
char code[ 16]; 
) Node; 
typedef struct ( 
Node * Nodes; 
int R; 
int N; 
) HTree; 
void clrHTree(HTree * 0; 
HTree Huffman(char * C, int * f, int n, int r); 
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3. 单 源 最 短路 径 头 文件 dijkstra. h 


# define dblinfy DBL_MAX 
pair dijkstra(double * w, int n, int s); 


void printPath(int * pi, int s, int i); 


4. 最 小 生成 树 头 文件 prim. h 


pair mstPrim(double * w,int n,int r); 


19 图 的 搜索 类 函数 
1. 图 的 邻接 表 头 文件 graph.h 


typedef struct{ 
double weight; 
int index; 
) vertex; 
typedef struct Graph{ 
LinkedList ** adj; 
int n; 
) Graph; 
typedef enum {WHITE,GRAY,BLACK) Color; 
Graph * createGraph(double * a. int n); 
Graph * zeroGraph(int n) ; 
void graphClear(Graph * g); 
Graph * transpose(Graph * g); 
Graph * cloneGraph(Graph * const g) ; 
void printGraph(Graph * g); 
void addVertex(Graph * g); 
void deleteVertex(Graph * g, int u); 
void addEdge(Graph * g, int u, int v. double w); 
void deleteEdge(Graph * g, int u, int v); 


2. 深度 优先 搜索 头 文件 dfs.h 


pair dfs(Graph * g); 


3. 拓扑 排序 头 文件 tpsort. h 


pair toplogicalSort(Graph * g); 


4. 强 连通 分 支 头 文件 scc. h 


LinkedList * strongConnectedComponents(Graph * g); 


5. 关 结 点 头 文件 articpoint. h 


LinkedList * articPoint(Graph * g, int s); 
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6. 深度 优先 搜索 头 文件 bfs. h 


pair bfs(Graph * g,int s); 


7. 最 大 流 头 文件 edmondskarp. h 


double * edmondsKarp(double * c. int n. int s, int t); 


12.1.10 文本 搜索 类 函数 


文本 搜索 头 文件 textmatch. h 

int find(char t, char p); / * 在 文本 串 t 中 查找 文本 模式 p 第 一 个 发 生 位 置 * / 
int * manacher(char * 0; / * 计算 文本 串 a 中 以 各 元 素 为 中 心 的 回 文 子 串 长 度 * / 
int optimalEditDistance(char * p, char * w); / * 计算 串 p 和 w 的 编辑 距离 / 

int * approximateMatch(char * p, char * t); /* 计 算 p 在 串 t 中 的 最 佳 近似 匹配 */ 

void solutionCchar * t, int * ad, int i, int j); /* 显 示 t 中 p 的 最 佳 近似 匹配 * / 


12.2 实验 平台 的 搭建 


12.2.1 集成 开发 环境 的 安装 


本 书 中 所 有 代码 都 是 在 Microsoft 公司 的 Windows 平台 上 ,在 Visual Studio 2010 中 实 
现 的 。Microsoft 公司 为 大 学 生 提供 了 Visual Studio 2010 的 学 习 版 。 这 是 一 款 全 免费 的 软 
件 ,读者 可 在 Microsoft 公司 官方 网 站 http://www. microsoft. com/ visualstudio/ en-us/ prod- 
ucts/2010-editions/visual-cpp-express 上 下 载 ,下 载 后 可 安装 。 安 装 界面 如 图 12-1 所 示 。 


欢迎 使 用 Visual Studio 2010 学 习 反 安装 

程序 一 -一 | 
且 用 易学 的 桂 简 版 工具 ， 适 用 于 爱好 者 、 初 学 者 和 学 生 等 
FRAR. 


选择 一 款 产 品 开始 去 装 。 如 果 收 请 在 显示 的 任何 
下 载 或 安全 警告 对 话 框 中 单 击 “ RAN A 


图 12-1 Visual Studio 2010 学 习 版 安装 界面 
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12.2.2 实验 项 目的 建立 


在 安装 了 Visual Studio 2010 学 习 版 的 系统 中 启动 Visual Studio 2010, 打 开 如 图 12-2 
所 示 的 窗口 。 


OTa c++ 2010 m 


[aE 


E nean 
声 近 使 用 的 项 目 = FART SWEAT LA RIO C + + SANER, E 
人 


图 12-2 Visual C++ 2010 启动 后 打开 的 窗口 


单 击 “ 文 件 ”>“ 新 建 ”>“ 项 目 ” 命 令 , 打 开 如 图 12-3 所 示 的 “新 建 项 目 ” 对 话 框 。 


= 


x 


LL (mam =) ED [wcemmes | 


irse 
pene iu Cet 

| C sm vv 

| 4 Visual co MFUATA 

[S] srm Visual Cos 


c Nusers visi documents lwisual studio 2010\Projects - m" 
可 


LE 


12-3 “新 建 项 目 ” 对 话 框 


在 左 窗 格 中 点 选 “ 常 规 ”, 在 中 部 窗 格 中 点 选 “ 空 项 目 ”。 

在 “名 称 ” 栏 中 输入 项 目 名 .例如 输入 laboratory. 

在 “位 置 ” 栏 中 选 定 项 目的 存储 文件 夹 路 径 。 

单 击 “确定 ”按钮 ,打开 的 IDE 窗口 如 图 12-4 所 示 。 

将 文件 夹 laboratory 中 的 所 有 子 文件 夹 复制 到 硬盘 上 新 建 的 项 目 文件 夹 laboratory 的 
子 文件 夹 laboratory 中 ,如 图 12-5 所 示 。 
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X RA + 


pana E 
22751 


20175 | 
20127779) 
212/779 


人 


amas 
Mi vo oat (6) 2012/1/9 
2127979 
[13 
2011/8 
MN XUZISHAN-PC ED 


B s 


12-5 复制 文件 


12.3 应 用 问题 程序 的 运行 实例 


要 在 12. 1 节 中 创建 的 实验 项 目 内 运行 书 中 应 用 问题 的 程序 ,可 按 下 列 步骤 进 


i 
a 


12.3.1 加 载 程序 文件 


以 运行 本 书 第 1 章 的 程序 1-7 为 例 ,说 明 如 何 加 载运 行 该 程序 所 需 的 源 文件 。 
(1) 启动 Visual C++ 2010 学 习 版 。 
在 IDE 中 打开 在 12. 1 节 中 建立 的 项 目 laboratory, 屏 幕 中 出 现 图 12-4 中 展示 的 窗口 。 
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(2) 右 击 项 目 右 窗 格 中 “ 源 文件 ”图 标 。 在 弹出 式 菜单 中 单 击 “ 添 加 ”一 “ 现 有 项 ”, 弹 出 
“添加 现 有 项 “对 话 框 ,如 图 12-6 所 示 。 


sw: E aotea minws arx 
pen pr ETATE A 
Rum 
m dk chapo2 2012/1/9 1053 EJ 
A can minws spa 
Aran E capot. 2012/1/9 1053 Ed mm. 
ne aun ana 
"iam pee mnno ana 
emaro D| cho? amus) ana 
dk (D). EMI 22191053 E d 
E Dunn ana 
Zawemm | em mum MO. mea - 
E ] 


图 12-6 “添加 现 有 项 “对 话 框 


双击 文件 夹 图 标 chap01, 在 打开 的 文件 夹 中 双击 文件 夹 图 标 SearchEnging, 对 话 框 如 
图 12-7 所 示 。 在 打开 的 文件 夹 中 选择 源 文件 searchengine. c, 单 击 “ 添 加 ”按钮 。 


naam a2 
20031120020 xxm 


" 
DE 
: srzetopen 
Cgeti/searchenging/outputaata, txt," 
"asservCriaafz) 


fgetsfirst, B0, t1); /"i 8i 4 R69) 
qune 


图 12-7 选择 需 添加 的 程序 源 文件 


双击 IDE 左 窗 格 中 文件 searchengine. c 图 标 ,在 编辑 区 域内 打开 该 文件 。 此 时 ,IDE 窗 
口 形象 如 图 12-8 所 示 。 


Em -]23 33: &I B EEE 


图 12-8 在 IDE 编辑 区 中 打开 源 文件 
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(3) 重复 第 (2) 步 。 继 续 在 项 目 中 添加 现 有 项 utility/strstream. c, utility/compare. c 和 
utility/search, h, 


12.3.2 调试 程序 


程序 文件 加 载 完 毕 后 ,就 可 以 对 程序 进行 调试 了 。 

CD 在 IDE 中 单 击 “ 生 成 >“ 重新 生成 laboratory”, 编 译 、 链 接 程序 。 

(2) 在 程序 中 合适 的 地 方 设置 断 点 ( 单 击 行 号 前 区 域 , 断 点 显示 为 一 红色 小 球 , 再 次 单 
击 将 取消 断 点 ) ,如 图 12-9 所 示 。 


12-9 在 程序 中 设置 断 点 


G) 菜单 “调试 "一 “启动 调试 "。 程 序 执行 到 第 1 个 断 点 ( 见 图 12-10) 处 即 可 逐 过 程 或 
逐 语句 地 调试 程序 了 。 可 以 在 下 窗 格 中 观察 各 个 局 部 变量 的 当前 值 。 


123 3:88 3-.| 


图 12-10 设置 断 点 调试 程序 
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12.3.3 各 应 用 问题 加 载 文件 清单 


本 书 从 第 1 一 10 章 一 共有 45 个 应 用 问题 ,对 每 个 问题 均 给 出 了 完整 的 C 程序 。 读 者 可 
F 11. 3. 2 节 的 步骤 方法 加 载运 行程 序 所 需 的 文件 ,调试 运行 之 。 需 要 注意 的 是 ,在 加 载 一 
个 新 的 程序 所 需 文 件 前 ,如 果 项 目 中 含有 其 他 程序 的 文件 ,应 该 在 右 窗 格 中 的 “ 源 文件 ”逻辑 
目录 下 右 击 每 一 个 文件 ,并 在 弹出 式 菜单 中 点 选 “ 从 项 目 中 排除 ”, 加 以 清理 ( 千 万 不 要 选 “ 从 
项 目 中 移 除 ”, 那 样 会 导致 文件 从 磁盘 中 彻底 删除 )。 本 节 列 出 这 45 个 应 用 问题 程序 加 载 文 
件 清单 ,方便 读者 实验 。 

第 1 章 

1. 搜索 引擎 问题 

chap01/SearchEnging/searchengine. c 

utility/compare. c 


utility/search. h 


utility/strstream. c 

2. Joseph 问题 

chap01/Joseph/Joseph. c 

3. Esecape 问题 

chap01/Esecape/Escape 

4. Counting Quadrangles 问题 

chap01/Counting Quadrangles/CountingQuadrangles. c 
第 2 章 

1. 数据 规范 问题 (链表 版 本 ) 


chap02/normalize/normalize. c 
datastructure/ list. c 
utility/compare. c 


utility/strstream. c 
2. Eventually periodic sequence 问题 


chap02/Eventually periodic sequence/Eventuallyperiodicsequence. c 
datastructure/stack. c 

datastructure/ list. c 

utility/compare. c 

utility/strstream. c 


utility/search. c 
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3. 像素 转换 问题 


chap02/pixeltransform/pixeltransform. c 
datastructure/queue. c 


datastructure/list. c 
4. What Fix Notation 问题 


chap02/What Fix Notation/WhatFixNotation. c 
datastructure/binarytree. c 
utility/strstream. c 


utility/output. c 
5. 数据 规范 问题 ( 红 黑 树 树 版 本 ) 


chap02/normalize/normalizel. c 
datastructure/redblacktree. c 
utility/compare. c 


utility/strstream. c 
6. Crazy Search 问题 


chap02/Crazy Search/CrazySearch. c 
datastructure/hashtable. c 
datastructure/ list. c 


utility/compare. c 
第 3 章 
1. Tour de France 问题 


chap03/Tour De France/TourdeFrance. c 
utility/randomn. c 

utility/compare. c 

utility/partition. c 

utility/quicksort. c 

utility/select. c 

utility/swap. c 


2. GetThelInversion 问题 
chap03/GetThelInversion/GetThelInversion. c 
3. Department 问题 


chap03/Department/Department. c 
utility/heap. c 

utility/swap. c 

datastructure/ list. c 


datastructure/pqueue. c 
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1. Complete the sequence 问题 


chap04/Complete the sequence/Completethesequence. c 
algebra/lup. c 

algebra/matrix. c 

algebra/poly. c 

algebra/rational. c 


utility/swap. c 
2. Equivalent Polynomial 问题 


chap04/Equivalent Polynomial/EquivalentPolynomial. c 
algebra/poly. c 


3. Rational Approximation 问题 


chap04/Rational Approximation/RationalA pproximation. c 
algebra/lup. c 

algebra/matrix. c 

algebra/poly. c 

algebra/ rational. c 


utility/swap. c 


第 5 章 
1. PiPe 问题 


chap05/pipe/ pipe. c 
geometry/ point. c 


2. Smallest Bounding Rectangle 问题 


chap05/Smallest Bounding Rectangle/SmallestBoundingRectangle. c 
chap05/overlaprectangle. c 
datastructure/list. c 
datastructure/stack. c 
geometry/convexhull. c 
geometry/ point, c 
utility/most. c 
utility/partition. c 
utility/quicksort. c 
utility/swap. c 

3. Texas Trip 问题 


chap05/TexasTrip/TexasTrip. c 
chap05/overlaprectangle. c 
datastructure/ list. c 


datastructure/stack. c 
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geometry/convexhull. c 
geometry/ point. c 
utility/most. c 
utility/partition. c 
utility/quicksort. c 
utility/swap. c 


第 6 章 
1. The X Problem 问题 


chap06/The X Problem/TheXProblem. c 
numbertheory/bigint. c 
numbertheory/ valuecalc. c 


datastructure/ list. c 

2. The Hardest Problem Ever 问题 

chap06/The Hardest Problem Ever/TheHardestProblemEver. c 
3. Jugs 问题 


chap06/Jugs/Jugs. c 
numbertheory/bigint. c 
numbertheory/ valuecalc. c 
numbertheory/gcd. c 


datastructure/ list. c 
4. 青蛙 约会 问题 
chap06/ 青 蛙 约会 /青蛙 约会 . c 


numbertheory/bigint. c 
numbertheory/ valuecalc. c 
numbertheory/gcd. c 
numbertheory/lequation. c 


datastructure/ list. c 
5. Smith Numbers 问题 


chap06/Smith Numbers/SmithNumbers. c 
numbertheory/bigint. c 

numbertheory/ valuecalc. c 
numbertheory/exponent. c 
numbertheory/factor. c 
numbertheory/gcd. c 
numbertheory/primetest. c 
datastructure/hstb. c 

datastructure/hstbl. c 

datastructure/list. c 


datastructure/ redblacktree. c 
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utility/compare. c 


utility/random. c 
第 7 章 
1. Queens in peaceful positions 问题 


chap07 /Queens in peaceful positions/Queensinpeacefulpositions. c 
btrack/combineproblem. c 

btrack/permutetree. c 

datastructure/ list. c 

datastructure/stack. c 


utility/swap. c 
2. Color the Map 问题 


chap07/Color the Map/ColortheMap. c 
btrack/backtrackiter. c 
btrack/combineproblem. c 
btrack/mcolor. c 

datastructure/ list. c 


geometry/ point, c 
3. Divisibility 问题 


chap07 /Divisibility/Divisibility. c 
btrack/combineproblem. c 
btrack/subsettree. c 


datastructure/ list. c 
4. Calculate A Route 问题 


chap07/Calculate A Route/CalculateARoute. c 
btrack/combineproblem. c 

btrack/permutetree. c 

datastructure/list. c 

datastructure/stack. c 


utility/swap. c 
5. Graph Coloring 问题 


chap07/Graph Coloring/GraphColoring. c 
btrack/combineproblem. c 
btrack/subsettree. c 


datastructure/list. c 
6. Communication System 问题 


chap07 /Communication System/CommunicationSystem. c 
btrack/backtrackiter. c 


btrack/combineproblem. c 
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datastructure/ list. c 

第 8 章 

1. Cow Solitaire 问题 
chap08/Cow Solitaire/CowSolitaire. c 
2. Hero Shoot Eagle 问题 


chap08/Hero Shoot Eagle/HeroShootEagle. c 
dprog/les. c 

datastructure/list. c 

utility/compare. c 

utility/partition. c 

utility/quicksort. c 

utility/strstream. c 


utility/swap. c 

3. Human Gene Functions 问题 

chap08/Human Gene Functions/ HumanGeneFunctions. c 
4. Happy Travel 问题 


chap08/Happy Travel/HappyTravel. c 
dprog/knapsack. c 


5. The cicerones abacus 问题 


chap08/The cicerone's abacus/The cicerone’s abacus. c 
dprog/knapsack. c 


datastructure/pair. c 
6. Bronze Cow Party 问题 


chap08/Bronze Cow Party/BronzeCowParty. c 
dprog/floyd. c 

datastructure/pair. c 

utility/compare. c 

utility/partition. c 

utility/select. c 

utility/swap. c 

utility /randomn. c 


第 9 章 
1. Radar Installations 问题 


chap09 /Radar Installations/RadarInstallations. c 
greedy/actsel. c 
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2. Variable Radix Huffman Encoding 问题 


chap09/ Variable Radix Huffman Encoding /VariableRadixHuffmanEncoding. c 
greedy/huffman. c 

datastructure/pqueue. c 

utility/heap. c 

utility/swap. c 


3. Arctic Network 问题 


chap09/ Arctic Network/ArcticNetwork. c 
greedy/prim. c 

datastructure/ pqueue. c 
datastructure/pair. c 

utility/heap. c 

utility/swap. c 


utility/compare. c 
4. Pipe Laying Problem 问题 


chap09/Pipe Laying Problem/PipeLayingProblem. c 
greedy/dijkstra. c 

datastructure/ pqueue. c 

datastructure/pair. c 

gepmetry/point. c 

utility/heap. c 

utility/swap. c 


utility/compare. c 
第 10 章 
1. Sorting It All Out 问题 


chap10/Sorting It All Out/sortingitallout. c 
datastructure/list. c 

datastructure/ pair. c 

datastructure/stack. c 

graph/graph. c 

graph/tpsort. c 


2. Quote Calling Circles 问题 


chap10/Quote Calling Circles/Quotecallingcircles. c 
datastructure/ list. c 

datastructure/ pair. c 

datastructure/stack. c 

graph/graph. c 

graph/scc. c 
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3. Bonnie and Clyde 问题 


chap10/Bonnie and Clyde/BonnieandClyde. c 
datastructure/list. c 

datastructure/pair. c 

datastructure/stack. c 

graph/graph. c 

graph/dfs. c 


graph/articpoint. c 
4. Risk 问题 


chap10/Risk/Risk. c 
datastructure/list. c 
datastructure/pair. c 
datastructure/queue. c 
graph/graph. c 
graph/bfs. c 


5. Internet Bandwidth 问题 


chap10/Internet Bandwidth/InternetBandwidth. c 
datastructure/ list. c 

datastructure/pair. c 

datastructure/queue. c 

graph/graph. c 

graph/ bfs. c 

graph/edmondsKarp. c 


第 11 章 
1. DNA Laboratory 问题 


chapll/DNA Laboratory/DNA Laboratory. c 
datastructure/ list. c 

utility/listpatition. c 

utility/listquiksort. c 

utility/random. c 


utility/swap. c 
2. Palindrome 问题 


chap11/Palindrome/Palindrome. c 
utility/textmatch. c 


3. String Matching 问题 


chapll/String Matching/StringMatching. c 


algebra/ rational. c 
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12.4 函数 库 的 扩展 


可 以 用 两 种 方式 向 函数 库 中 增加 函数 ,其 一 是 向 已 有 的 源 文件 中 添加 函数 定义 代码 ,在 相 
应 的 的 头 文件 中 添加 函数 的 原型 声明 。 其 二 是 添加 独立 存储 的 新 源 文件 及 相应 的 头 文件 。 本 
节 以 第 1 章 中 算法 1-2 描述 的 二 分 查找 算法 的 实现 为 例 , 说 明 函 数 库 扩展 的 这 两 种 方法 。 


12.4.1 向 已 有 的 源 文件 中 添加 新 函数 


在 第 1 章 的 节 1. 1 中 我 们 知道 二 分 查找 算法 适用 于 在 排 好 序 的 序列 中 查找 等 于 指定 值 
的 元 素 。 我 们 把 算法 1-2 的 伪 代 码 过 程 再 现 于 下 。 


BINARY-SEARCH(A, x) 
1 p41, r-length[A] 

2 while pcr 

3 do q-- | (p+r)/2 | 


4 if A[q]=x 

5 then return q 
6 if A[q] x 

7 then p<-q 十 1 
8 else r--2—1 

9 return— 1 


其 中 ,参数 A 表示 一 个 有 序 序列 ,x 表示 待 查 的 关键 值 。 

可 以 在 C 语 言 中 将 此 算法 实现 为 一 个 对 存储 为 数组 的 有 序 序列 a 查找 特定 关键 值 x 的 
函数 。 

int binSearch(void * a, int size, int n. void * x, int( * comp) (void * , void * )){ 


int p=0,r=n—1.q,c3 
whileCp— — r) ( 


q=(ptr)/2; 
c=comp(x, (char * )a+q * size); 
if(c==0) 
return q; 
if(c>0) 
p 一 q 十 1; 
else 
T 一 q 一 1; 
) 
return —1; 


} 


在 实验 项 目 中 加 载 Utility 文件 夹 下 的 源 文件 search. c。 将 上 述 函 数 binSearch 的 定义 
代码 添加 在 该 文件 尾部 。 
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在 实验 项 目 中 加 载 Utility 文件 夹 下 的 头 文件 search. h。 将 函数 binSearch 的 原型 声明 
int binSearch(void * a, int size, int n. void * x. int( * comp) (void * , void * )); 
添加 进去 。 
然后 重新 生成 项 目 。 若 在 应 用 中 需要 调用 此 函数 ,可 以 在 适当 的 位 置 添加 指令 * # in- 
clude "…utility/search. h"”, 并 在 项 目 中 加 载 源 文件 search. c. 


12.4.2 创建 新 的 源 文件 


可 以 用 以 下 代码 对 链表 实现 算法 1-2. 


ListNode * listBinSearch(LinkedList *L, void * x){ 
int p=0,r=L->n—1.qsc3 
ListNode * P—L-»nil-»next, * R=L->nil->prev, * Q; 
while(p— =r) ( 
q=(p+r)/2; 
Q=advance(P,q); 
c=L->comp(x, Q->key); 
if(c— —0) 
return Q; 
if(c>0){ 
P=Q->next; 
p-qtl; 
Jelse( 
R=Q-> prev; 
r=q— l; 
) 
) 
return NULL; 
} 


由 于 对 链表 的 先行 查找 已 经 实现 为 listc 中 的 一 个 函数 listSearch, 可 以 把 上 述 函 数 
存储 为 独立 的 源 文件 ,便于 代码 重用 。 为 此 ,在 项 目 中 向 文件 夹 Utility 添加 新 的 源 文件 
listbinsearch. c, 将 上 述 代码 录入 其 中 。 在 同一 文件 夹 中 添加 新 的 头 文件 listbinsearch. h, 将 
下 列 与 变异 指令 和 函数 listBinSearch 的 原型 声明 


# include "../datastructure/list. h" 
ListNode * listBinSearch(LinkedList * L, void * x); 


添加 进去 BEE AE ML ita BEA HANA PRU Iz FSH SSNS & * € include 
".+-utility/listbinsearch. h"”, 并 在 项 目 中 加 载 Utility 文件 夹 中 的 源 文件 listbinsearch. c. 
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